Увод у креирање стабла одлука
С недавним брзим растом количине података генерисаних од стране информационих система, како би се управљало великим скупима података, постоји доминантна потреба за стаблом одлука за смањење сложености рачунања. Стабло одлука може се сматрати најважнијим приступом представљања класификатора. Другим речима, можемо рећи да су подаци структурирани користећи стратегију поделе и освајања. до сазнања да смо само истраживали. Стабло одлука структурирано је као оквир за прецизирање вриједности и вјероватноће одлука исхода
м сваки ниво чвора, помажући доносиоцима одлука да одаберу тачна предвиђања међу различитим неприкладним подацима. У овом ћете чланку представити како на једноставан начин креирати стабло одлука засновано на узорцима података.
Шта је стабло одлуке?
Стабло одлука је бинарна хијерархијска структура која идентифицира начин на који је сваки чвор подијелио скуп података на основу различитих увјета. Да се конструише оптимално стабло са моделним приступом за класификацију варијабле одговора која предвиђа вредност циљне варијабле са једноставним правилима одлучивања (иф-тхен-елсе изјаве). Приступ је надгледано учење које се углавном користи у проблемима класификације и сматра се врло ефикасним предиктивним моделом. Користе се у различитим областима примене попут теорије игара, вештачке интелигенције, машинског учења, вађења података и областима као што су безбедност и медицина.
Како креирати стабло одлука?
Стабло одлука се ствара на једноставне начине одозго према доље; састоје се од чворова који творе усмерени чвор који има коријенске чворове без долазних ивица, сви остали чворови називају се чворови одлуке (унутрашњи чвор и лист чворова који одговара ознакама атрибута и класе) са најмање једним долазним ивицама. Главни циљ из скупа података је минимизирати генерализацијске грешке проналажењем оптималног рјешења у стаблу одлука.
Пример стабла одлуке објашњава се у наставку помоћу узорка података. Циљ је предвидјети да ли ће профит опадати или расти користећи атрибуте живота и конкуренције. Овде су променљиве стабла одлучивања категоричне (Да, Не).
Скуп података
Живот | Конкуренција | Тип | Профит |
Стари | да | Софтвер | Доле |
Стари | Не | Софтвер | Доле |
Стари | Не | Хардвер | Доле |
Средина | да | Софтвер | Доле |
Средина | да | Хардвер | Доле |
Средина | Не | Хардвер | Горе |
Средина | Не | Софтвер | Горе |
Нова | да | Софтвер | Горе |
Нова | Не | Хардвер | Горе |
Нова | Не | Софтвер | Горе |
Из горњег скупа података: живот, конкуренција, Врста су предиктори, а циљ атрибута циљ. Постоје различити алгоритми за имплементацију стабла одлука, али најбољи алгоритам који се користи за прављење стабла одлука је ИД3 који је наглашен на похлепном приступу претраживања. Стабло одлуке слиједи правило закључивања одлуке или дисјунктивни нормалан облик (^).
Дрво одлуке
У почетку се сви атрибути тренинга сматрају кореном. Приоритет редоследа за постављање атрибута као роот обавља се следећим приступом. Овај процес је познат по одабиру атрибута како би се идентификовао који атрибут је коријенски чвор на сваком нивоу. Дрво следи два корака: изградња стабла, обрезивање дрвета. А подаци су подељени у свим чворовима одлучивања.
Информације добитак
То је мера промене ентропије заснована на независној варијабли. Стабло одлука мора пронаћи највећи добитак од информација.
Ентропија
Ентропија је дефинирана као за коначни скуп, мјера случајности у подацима или предвидљивости догађаја, ако је узорак сличних вриједности, тада је ентропија једнака нули, а ако је једнако подијељена с узорком, тада је једна.
Ентропија за класу
Где је п вјероватноћа добитка рећи „да“, а Н је губитак, реците „не“.
према томе, ентропија = 1
Након што се израчуна вриједност ентропије, потребно је одлучити роот чвор из атрибута.
Ентропија старости
Према скупу података за атрибут Лифе имамо старо = 3 доле, средње = 2 доле и једно према горе за ознаку профита.
Живот | Пи | ни | И (пи, ни) | |
Стари | 0 | 3 | 0 | |
Средина | 2 | 2 | 1 | |
Нова | 3 | 0 | 0 |
Добит = класа ентропија - ентропија живота = 1 - 0, 4 = 0, 6
Ентропија (конкуренција) = 0, 87
Конкуренција | Пи | ни | И (пи, ни) | |
да | 1 | 3 | 0.8 | |
Не | 4 | 2 | 0, 9 |
Добитак = Класа ентропија - Ентропија живота = 1 - 0, 87 = 0, 12
Сада се проблем појављује у атрибуту Живот где средина има једнаку вероватноћу и на горе и на доле. према томе, ентропија је 1. слично томе, израчунава се за атрибут типа опет ентропија је 1 и добитак је 0. Сада је створена комплетна одлука да се добије тачан резултат за средњу вредност.
Предности стабла одлуке
- Лако их је разумети, а генерисана правила су флексибилна. Има мало напора за припрему података.
- Визуелни приступ представљању одлука и резултата је од велике помоћи.
- Стабло одлука обрађује скуп података са тренинга с грешкама и недостајућим вриједностима.
- Могу да обрађују дискретну вредност и нумерички атрибут. Ради категоријске и континуиране варијабле за улаз и излаз.
- Они су корисно средство за пословни домен који мора да доноси одлуке након анализе под одређеним условима.
Недостаци стабла одлучивања
- Ученици могу да направе сложено стабло одлука у зависности од обучених података. овај процес се назива префињеним, тешким процесом у моделима стабла одлука.
- Вриједности које се преферирају бити су категоричне, ако је континуирано, стабло одлука губи информације што доводи до склоности грешкама. Експоненцијални раст израчуна је већи током анализе.
- Многе етикете класе воде до погрешних сложених израчунавања и дају ниску тачност предвиђања скупа података.
- Информације добијене у ДТ алгоритму дају пристрани одговор на категорички веће вриједности.
Закључак
Стога, за закључак, стабла одлука пружају практичну и једноставну методу за учење и надалеко позната као ефикасни алати за машинско учење јер у кратком времену постижу добре резултате са великим скуповима података. То је задатак учења који користи статистички приступ да би дао општи закључак. Сада је боље разумљиво зашто се стабло одлука користи у предиктивном моделирању, а за научнике података они су моћно средство.
Препоручени чланци
Ово је водич за креирање стабла одлука. Овде смо расправљали о томе како креирати стабло одлука заједно са разним предностима и недостацима. Можете и да прођете кроз друге наше предложене чланке да бисте сазнали више -
- Преглед стабла одлука у Р
- Шта је алгоритам стабла одлучивања?
- Увод у алате за вештачку интелигенцију
- Топ 10 питања за интервју са вештачком интелигенцијом