Увод у стабло одлука у машинском учењу

Стабло одлука у машинском учењу има широко поље у савременом свету. Постоји пуно алгоритама у МЛ који се користе у нашем свакодневном животу. Један од важних алгоритама је стабло одлука које се користи за класификацију и такође решење за регресијске проблеме. Како се ради о предиктивном моделу, анализа стабла одлука врши се алгоритамским приступом, при чему се скуп података дели на подскупове према условима. Сам назив каже да је у облику стабла модел у облику изјава ако тада. Што је дубље дрво и више су чворови, бољи је модел.

Врсте стабла одлука у машинском учењу

Стабло одлука је граф налик на дрвеће, где сортирање започиње од коријенског чвора до чвора листа док се циљ не постигне. Он је најпопуларнији за одлучивање и класификацију на основу надзираних алгоритама. Конструира се рекурзивном партицијом гдје сваки чвор дјелује као тестни случај за неке атрибуте, а сваки руб, који произлази из чвора, је могући одговор у тестном случају. И коријен и чворови листа су два ентитета алгоритма.

Да разумемо уз помоћ малог примера на следећи начин:

Овде је коријенски чвор да ли сте мањи од 40 или не. Ако је тако, да ли једете брзу храну? Ако да, онда сте неподобни, или у супротном. А ако имате више од 40 година, да ли онда вежбате? Ако је тако, онда сте у стању, или у супротном нисте подобни. То је у основи била бинарна класификација.

Постоје две врсте стабала одлучивања:

  1. Стабла класификације: Горњи пример је стабло класификације на основу категоризације.
  2. Регресијска стабла : У овој врсти алгоритма одлука или резултат су континуирани. Добио је један нумерички излаз са више улаза или предиктора.

У стаблу одлуке типичан је изазов идентификовање атрибута на сваком чвору. Процес се назива одабир атрибута и има неке мере које треба користити да би се идентификовао атрибут.

а. Добит информација (ИГ)

Информатион Гаин мери колико информација има поједина карактеристика о класи. Он делује као главни кључ за изградњу стабла одлука. Атрибут са највећим информацијама добије прво. Дакле, стабло одлука увек максимално повећава информациони добитак. Кад користимо чвор за подјелу инстанци на мање подскупине, тада се ентропија мијења.

Ентропија: То је мера несигурности или нечистоће у случајној варијабли. Ентропија одлучује о томе како стабло одлука дели податке на подгрупе.

Једнаџба за добивање информација и ентропија је сљедећа:

Добит информација = ентропија (родитељ) - (пондерирани просек * ентропија (деца))

Ентропија: ∑п (Кс) лог п (Кс)

П (Кс) овде је део примера у датој класи.

б. Гини индекс

Гини индекс је метрика која одлучује о томе колико често би насумично одабрани елемент био погрешно идентификован. Јасно се каже да се предност даје атрибуту са ниским Гини индексом.

Гини индекс: 1-∑ п (Кс) 2

Сплит стварање

  1. Да бисмо створили поделу, прво морамо израчунати Гини резултат.
  2. Подаци су подељени помоћу листе редова који садрже индекс атрибута и вредност подељења тог атрибута. Након што се нађе десни и лијеви скуп података, можемо добити вриједност подијељења према Гини резултату из првог дијела. Сада ће подељена вредност бити одлука у којој ће атрибут боравити.
  3. Следећи део је процена свих подјела. Најбоља могућа вредност израчунава се проценом трошкова дељења. Најбољи сплит се користи као чвор Стабла одлука.

Изградња стабла - стабло одлука у машинском учењу

Постоје два корака за изградњу стабла одлука.

1. Стварање терминалних чворова

Приликом креирања терминалног чвора најважније је напоменути да ли треба зауставити раст стабала или наставити даље. За то се могу користити следећи начини:

  • Максимална дубина стабла: Када дрво досегне максимални број чворова, извршење се зауставља.
  • Минимални записи о чвору: могу се дефинирати као минимални обрасци које чвор захтијева. Тада можемо престати додавати терминалне чворове одмах, добивамо оне минималне записе о чворима.

2. рекурзивно цепање

Једном када се чвор створи, можемо створити дечји чвор рекурзивним дељењем скупа података и позивањем исте функције више пута.

Предвиђање

Након што је стабло изграђено, предвиђање се врши помоћу рекурзивне функције. Исти поступак предвиђања поново је праћен са левим или десним дечјим чворовима и тако даље.

Предности и недостаци стабла одлучивања

Испод су дате неке предности и недостаци:

Предности

Стабло одлука има неке предности у Машинском учењу како слиједи:

  • Свеобухватно: Узима се у обзир сваки могући исход одлуке и у складу с тим прати сваки чвор до закључка.
  • Специфично: Стабла одлучивања додељују одређену вредност сваком проблему, одлуци и исходу. Умањује неизвесност и двосмисленост и такође повећава јасноћу.
  • Једноставност: Стабло одлука је један од лакших и поузданијих алгоритама, јер нема сложене формуле или структуре података. За прорачун су потребне само једноставне статистике и математике.
  • Свестрано: Стабла одлука могу се ручно конструисати помоћу математике и могу се користити с другим рачунарским програмима.

Недостаци

Стабло одлука има неких недостатака у Машинском учењу како слиједи:

  • Стабла одлука су мање погодна за процене и финансијске задатке где су нам потребне одговарајуће вредности.
  • То је алгоритам класификације склоног грешкама у поређењу с другим рачунским алгоритмима.
  • Рачунало је скупо. На сваком чвору мора се подијелити кандидат прије него што се утврди најбољи. Постоје и друге алтернативе које многи привредни субјекти следе за финансијске задатке јер је стабло одлука прескупо за процену.
  • Иако раде са континуираним варијаблама, стабло одлука није најбоље рјешење јер губи информације док категоризира варијабле.
  • Понекад је нестабилно јер мале варијације у скупу података могу довести до формирања новог стабла.

Закључак - Стабло одлука у машинском учењу

Као један од најважнијих и надзираних алгоритама, стабло одлука игра виталну улогу у анализи одлука у стварном животу. Као предиктивни модел користи се у многим областима због свог подељеног приступа који помаже у идентификовању решења која се заснивају на различитим условима било класификацијом или регресијском методом.

Препоручени чланци

Ово је водич за стабло одлука у машинском учењу. Овдје ћемо расправљати о уводу, врстама стабла одлучивања у машинском учењу, стварању и изградњи стабла. Можете и да прођете кроз друге наше предложене чланке да бисте сазнали више -

  1. Типови података Питхон-а
  2. Сетови података Таблеау
  3. Цассандра Дата Моделинг
  4. Тестирање табеле одлука
  5. Топ 8 фаза животног циклуса машинског учења

Категорија: