Увод у ненадзирано машинско учење

Да ли сте икада размишљали о томе како дете може да разликује јабуке и наранџе када не зна шта они заправо јесу, како имају укус, али на основу боје и величине може их раздвојити у две групе без икаквих претходних информација? Да ли можемо да очекујемо исту сегментацију као што је то дете направи од машина ако нам дају информације о боји и величини? Да видимо како то можемо! У овој теми ћемо сазнати о Ненадзорованом машинском учењу.

„Машинско учење“ као што термин каже да подучавамо машине да раде задатке сличне човеку и како људи уче, било од некога или посматрањем. Исто као и људи, начин на који машина учи.

Машинско учење може се поделити у 3 дела: -

  1. Надзирано учење
  2. Ненадзоровано учење
  3. Ојачавање учења

Врсте машинског учења

Ојачавање учења је учење засновано на агентима које укључује награду и казну због радњи које је извршио агент. Крајњи циљ је повећати укупну награду у процесу учења из окружења.

Када имате улазно-излазне податке, укратко, на пример означени подаци, на основу висине и тежине да бисте утврдили да ли је особа мушкарац или жена могу се сматрати надгледаним учењем (од некога у случају људи).

Али у многим стварним сценаријима, ови обележени или напоменути подаци нису увек доступни. Много пута се сусрећемо са проблемима сегментирања објеката на основу њихових својстава која нису изричито наведена. Како решити овај проблем? Па, неконтролисано учење је решење.

Википедиа каже да је неконтролисано учење врста самоорганизованог хеббијског учења који помаже у проналажењу непознатих образаца у скупу података без претходно постојећих ознака. Код учења без надзора, немамо никакве податке о етикетама, али ипак, желимо добити увид из података на основу његових различитих својстава.

Врсте ненадзорованог машинског учења

Задаци учења без надзора могу се поделити у 3 категорије:

  1. Удружење влада рударством
  2. Кластерирање
  3. Систем препорука

1. Рударско правило удружења

Када имамо податке о трансакцији за нешто, то може бити за продате производе или било које податке о трансакцији за то је важно, желим знати да ли постоји неки скривени однос између купца и производа или производа према производу, тако да могу некако искористити ове информације да повећам продају. Извлачење ових односа језгра је асоцијације за рударјење правила. За вађење односа можемо користити алгоритме раста АИС, СЕТМ, Априори, ФП.

2. Кластерирање

Кластерирањем се могу направити сви подаци о којима немамо податке о класи или налепници. Желимо да групирамо податке тако да опажања са сличним својствима припадају истом кластеру / групи, а међу-кластер растојање треба да буде максимално. Док би размак унутар кластера требао бити минималан. Ми можемо скупити податке бирача како бисмо сазнали мишљење о влади или производима кластера, на основу њихових карактеристика и употребе. Становништво сегмента на основу карактеристика прихода или користи кластерирања у продаји и маркетингу.

Можемо користити К-средства, К-средства ++, К-медоиде, нејасна Ц-средства (ФЦМ),

Очекивање-максимизација (ЕМ), агломеративно кластерирање, ДБСЦАН, врсте хијерархијског кластерирања као једнострука веза, потпуна веза, средња веза, алгоритми Вард-ове методе за кластерирање.

3. Систем препорука

Систем препорука у основи је продужетак придруживања правила асоцијације у том смислу, у АРМ-у вадимо односе, а у систему препорука користимо те односе да бисмо препоручили нешто што крајњи корисник има веће шансе за прихватање. Системи препорука стекли су популарност након што је Нетфлик 2009. године објавио велику награду у износу од 1.000.000 УСД.

Систем препорука функционише на трансакцијским подацима било да се ради о финансијској трансакцији, е-трговини или трансакцији с трговинама намирницама. Данас огромни играчи у индустрији е-трговине намамљују купце доносећи прилагођене препоруке за сваког корисника на основу њихове прошлости историје куповине и сличних података о куповини других корисника.

Методе за развој препоручних система могу се широко поделити на колаборативно филтрирање и филтрирање на основу садржаја. У колаборативном филтрирању опет имамо корисничко-корисничко филтрирање и колабирање кроз ставку-ставку које су засновани на меморији, а матрична факторизација и сингуларна декомпозиција вредности (СВД) су засновани на моделу.

Примене ненадзорованог учења

Пошто се светски подаци из дана у дан огромно повећавају, неконтролирано учење има много примена. Увек стварамо податке користећи платформе друштвених медија или неки видео садржај на ИоуТубе-у, а много пута чак и не намерно. Сви ови подаци су неструктурирани и обележавање њих за надгледане задатке биће напорно и скупо.

Следе неке цоол апликације ненадзираног машинског учења.

  1. Трговина прехрамбеним производима или продавница / тржиште е-трговине: Правила за удруживање екстраката из података о трансакцијама и препорукама потрошача за куповину производа.
  2. Платформа друштвених медија: издвојите односе са различитим корисницима како бисте сугерисали производе или услуге. Препоручите нове људе због друштвеног повезивања.
  3. Услуге: Препоруке туристичких услуга, препоруке кућа за изнајмљивање или услуге повезивања.
  4. Банкарство: Кластери клијената на основу њихових финансијских трансакција. Лажна трансакција кластера за откривање преваре.
  5. Политика: Мишљење бирача кластера о шансама за победу за одређену странку.
  6. Визуализација података: Са групирањем и т-дистрибуираним стохастичким суседским уградњом (т-СНЕ) можемо визуализовати податке високих димензија. Такође, ово се може користити за смањење димензија.
  7. Забава: Препоруке за филмове, музику, као што раде Нетфлик и Амазон.
  8. Сегментација слике: Дијелови слика на кластеру на основу најближих вриједности пиксела.
  9. Садржај: персонализоване новине, препоруке веб страница, апликације за е-учење и филтери е-поште.
  10. Структурно откриће: Кластерирањем можемо открити било коју скривену структуру података. Подаци кластера цвркут за анализу осјећаја.

Закључак

Ненадзоровано машинско учење није превише мерљиво, али може да реши пуно проблема у којима надгледани алгоритми не успеју. Постоји много апликација за ненадзирано учење у многим доменима на којима имамо неструктуриране и необележене податке. Можемо користити ненадзиране технике учења да научимо наше машине да раде бољи посао од нас. У последњим годинама, машине су надмашиле људе у погледу задатака за које се вековима сматра да их човек решава. Надам се да сте помоћу овог чланка схватили шта је и како се могу надгледати технике машинског учења за решавање проблема у стварном свету.

Препоручени чланци

Ово је водич за ненадзирано машинско учење. Овде смо расправљали о врстама машинског учења и врстама машинског учења без надзора, заједно са његовим применама. Можда ћете такође погледати следеће чланке да бисте сазнали више -

  1. Алгоритми машинског учења
  2. Шта је машинско учење?
  3. Увод у машинско учење
  4. Алати за машинско учење
  5. Кластерирање у машинском учењу
  6. Машинско учење хиперпараметра
  7. Хијерархијски алгоритам кластерирања
  8. Хијерархијско кластерирање | Агломеративно и подељено кластерирање
  9. Топ 8 фаза животног циклуса машинског учења

Категорија: