Увод у КНН алгоритам у Р

У алгоритму КНН у Р, КНН означава К алгоритам најближег суседа, а Р је програмски језик. Кажу да је то најједноставнији алгоритам машинског учења. КНН је надзирани алгоритам који тачке података класификује у циљану класу упоређујући функције са најближим сусједом.

Пример: Претпоставимо да желите да класификујете екран осетљив на додир и телефон са тастатуром. Постоје различити фактори који укључују различита оба телефона. Међутим, фактор који разликује оба телефона је тастатура. Дакле, кад примимо тачку података (тј. Телефон). Упоредимо је са сличним карактеристикама суседских тачака података да бисмо их класификовали као тастатуру или телефон са додиром.

Значајке КНН алгоритма

Овде ћемо проучити карактеристике алгоритма КНН:

  • КНН алгоритам користи улазне податке да предвиди излазне скупове података.
  • Алгоритам се може применити на различите скупове проблема.
  • Усредсређује се на сличне карактеристике да бисте класификовали податке.
  • КНН алгоритам обрађује реалне податке и не даје никакве претпоставке о тачкама података.
  • КНН памти скуп података о тренинзима уместо да буде интуитиван. Такође, може се рећи да има лењи приступ.
  • Може да реши проблеме класификације и регресије.

Решавање проблема у алгоритам КНН у Р

Следеће решавање проблема:

1. Проблем класификације

У проблему са класификацијом вредности су дискретне баш као да ли желите да једете пиззу са преливима или без. Постоји заједничка основа. КНН алгоритам помаже у решавању таквог проблема.

2. Регресијски проблем

Проблем регресије долази у слику када имамо зависну променљиву и независну променљиву. Нпр: индекс БМИ. Обично сваки ред садржи посматрање или тачку података и пример.

Алгоритам КНН у Р

Погледајмо кораке у алгоритму који треба следити:

Корак 1: Учитајте улазне податке.

Корак 2: Иницијализирајте К са бројем најближих комшија.

Корак 3: Израчунавање података (тј. Удаљеност између струје и најближег суседа)

Корак 4: Додавање растојања тренутном наређеном скупу података.

Корак 5: Покупити К уносе и означити их.

Корак 6: Вратите средњу вредност за проблем регресије.

Корак 7: Вратите вредност начина за проблеме са класификацијом.

Тачке за памћење током примене КНН алгоритма

  • Требало би да будемо сигурни да је вредност К већа од једне, што омета предвиђање да буде тачно.
  • Што је вредност К већа, тачност предвиђања може бити последица већине.
  • Пожељно је да има К као непарни број. У супротном, то може довести до прекида веза.

КНН Псеудоцоде

У доњој формули представља варијабле и представља тачке података где је (и = 1, 2, 3….)

Set(, )

Користите случајеве

Следе случајеви употребе у КНН алгоритму у Р:

1. Упоређивање производа и помоћ у препорукама за куповину

Када купујемо лаптоп или рачунар са веб локације за електроничку трговину, такође видимо препоруке за куповину, попут куповине антивирусног софтвера или звучника. Све је то зато што када претходни купац купује лаптоп, углавном се купује заједно са антивирусима или звучницима. Машинско учење помаже у препорукама за е-трговину.

2. Препоруке за храну

Машинско учење такође помаже у препорукама на основу претходно наручене хране и такође предлаже ресторане.

Пример алгоритма КНН

Следе примери КНН алгоритма:

1. Увоз података

Узмимо податке о луткама о нама предвиђањем величине мајице момка уз помоћ висине и тежине.

Висина (цм) Тежина (кг) Величина
140 58 С
140 59 С
140 63 С
150 59 М
152 60 М
153 60 М
154 61 М
155 64 М
156 64 М
157 61 М
160 62 Л
161 65 Л
162 62 Л
163 63 Л
163 66 Л
165 63 Л
165 64 Л
165 68 Л

2. Проналажење сличности израчунавањем удаљености

Можемо користити и Манхаттан и Еуклидско растојање јер су подаци континуирани. Израчунавамо удаљеност између новог узорка и скупа података о тренингу, а затим проналазимо К-најближе.

Пример: Рецимо да Рај има висину од 165 цм и тежак 63 кг. Еуклидско растојање израчунавамо користећи прво опажање са новим узорком: СКРТ ((165-140) 2 + (63-58) 2)

3. Проналажење К-најближих суседа

Претпоставимо да је К = 4, постоје 4 купца код којих су 3 имала средње величине, а 1 велике величине. Најбоља прогноза су одијела средње величине Рај.

Разлика између КНН и К-средње вредности

Следе разлике:

  • КНН је надзирани алгоритам (зависна варијабла) док је средња вредност К алгоритам који није надзиран (нема зависне променљиве).
  • К-средње користи технику кластера за поделу тачака података формирајући К-кластере.КНН користи К-најближе суседе за класификацију података и комбинује их.

Предности и недостаци КНН

Следе предности:

  • КНН алгоритам је свестран, може се користити за класификацију и регресијске проблеме.
  • Нема потребе за претходним моделом за изградњу КНН алгоритма.
  • Једноставан и лаган за имплементацију.

Следе недостаци:

  • Алгоритам како се број узорака повећава (тј. Нема променљивих)

Препоручени чланци

Ово је водич за КНН алгоритам у Р. Овде разговарамо о значајкама, примерима, псеудокоду, корацима које треба следити у КНН Алгоритму. Можете и да прођете кроз наше друге сродне чланке да бисте сазнали више -

  1. Алгоритми за науку о подацима
  2. Шта је генетски алгоритам?
  3. Алгоритми усмјеравања
  4. Алгоритми неуронске мреже
  5. Ц ++ алгоритам | Примери алгоритма Ц ++

Категорија: