Наиве Баиесов алгоритам - Како то ради - Основни модели - Предности

Шта је алгоритам Наиве Баиес-а?

Наиве Баиесов алгоритам је техника која помаже у конструисању класификатора. Класификатори су модели који класификују проблематичне инстанце и дају им ознаке класе које су представљене као вектори предиктора или вредности својстава. Заснован је на Баиесовој теореми. Назван је наивним Баиесом јер претпоставља да вредност обележја не зависи од другог својства, тј. Промена вредности обележја не би утицала на вредност друге карактеристике. Из истог разлога је називају и идиот Баиес. Овај алгоритам делује ефикасно за велике скупове података, стога је најприкладнији за предвиђања у реалном времену.

Помаже да се израчуна задња вероватноћа П (ц | к) користећи претходну вероватноћу класе П (ц), претходну вероватноћу предиктора П (к) и вероватноћу давања предвиђеног класе, такође названу вероватноћом П (к | ц) ).

Формула или једначина за израчунавање постериорне вероватноће је:

П (ц | к) = (П (к | ц) * П (ц)) / П (к)

Како функционира алгоритам Наиве Баиес-а?

Разјаснимо функционирање алгоритма наивног Баиеса користећи примјер. Претпостављамо скуп података о тренингу и временску варијаблу 'Идемо у куповину'. Сада ћемо класификовати да ли ће девојка ићи у куповину на основу временских услова.

Дати скуп података је:

Веатхер	Иде у куповину
Сунчан	Не
Кишна	да
Облачно	да
Сунчан	да
Облачно	да
Кишна	Не
Сунчан	да
Сунчан	да
Кишна	Не
Кишна	да
Облачно	да
Кишна	Не
Облачно	да
Сунчан	Не

Следећи кораци би били изведени:

Корак 1: Направите табеле фреквенција помоћу скупова података.

Веатхер	да	Не
Сунчан	3	2
Облачно	4	0
Кишна	2	3
Укупно	9	5

Корак 2: Направите табелу вероватноће израчунавањем вероватноће сваког временског стања и одласком у куповину.

Веатхер	да	Не	Вероватноћа
Сунчан	3	2	5/14 = 0, 36
Облачно	4	0	4/14 = 0, 29
Кишна	2	3	5/14 = 0, 36
Укупно	9	5
Вероватноћа	9/14 = 0, 64	5/14 = 0, 36

Корак 3: Сада морамо израчунати задњу вероватноћу користећи Наиве Баиесову једначину за сваку класу.

Примјер проблема: Дјевојчица ће ићи у куповину ако је вријеме облачно. Да ли је та изјава тачна?

Решење:

П (Да | Облачно) = (П (Облачно | Да) * П (Да)) / П (Облачно)
П (Облачно | Да) = 4/9 = 0, 44
П (Да) = 9/14 = 0, 64
П (облачно) = 4/14 = 0, 39

Сада ставите све израчунате вредности у горњу формулу

П (Да | Облачно) = (0, 44 * 0, 64) / 0, 39
П (да | облачно) = 0.722

Класа која има највећу вероватноћу био би исход предвиђања. Користећи исте вероватноће приступа могу се предвидјети из различитих класа.

За што се користи алгоритам Наиве Баиес-а?

1. Предвиђање у реалном времену: Алгоритам Наиве Баиеса брз је и увек спреман да научи, па је стога најприкладнији за предвиђања у реалном времену.

2. Предвиђање више класа: Вероватноћа мулти-класе било које циљне варијабле може се предвидјети помоћу алгоритма Наиве Баиес.

3. Систем препорука: Наиве Баиесов класификатор уз помоћ колаборативног филтрирања гради систем препорука. Овај систем користи технике ископавања података и машинског учења како би филтрирао информације које раније нису виђене и затим предвидио да ли ће корисник ценити одређени ресурс или не.

4. Класификација текста / Анализа осећања / Филтрирање нежељене поште: Због својих бољих перформанси код проблема више класе и правила независности, алгоритам Наиве Баиес-а боље ради или има већу успешност у класификацији текста, па се користи у анализи осећаја и Филтрирање нежељене поште.

Предности алгоритма Наиве Баиес

Једноставно за имплементацију.
Брзо
Ако важи претпоставка независности, она функционише ефикасније од осталих алгоритама.
Захтијева мање података о обуци.
Високо је скалабилна.
Може да даје вероватна предвиђања.
Може да обрађује и континуиране и дискретне податке.
Неосјетљив према небитним особинама.
Може се лако радити с недостајућим вредностима.
Лако се ажурира по доласку нових података.
Најприкладније за проблеме са класификацијом текста.

Недостаци алгоритма Наиве Баиес

Снажна претпоставка о карактеристикама да су независне што је тешко тачно у стварним апликацијама.
Недостатак података.
Шансе за губитак тачности.
Нулта фреквенција, тј. Ако се категорија било које категоричке варијабле не види у скупу података о тренинзима, тада модел додељује нултој вероватноћи тој категорији и тада се не може предвидети.

Како изградити основни модел користећи алгоритам Наиве Баиес-а

Постоје три врсте Наиве Баиес модела: Гауссиан, Мултиномиал и Берноулли. Разговарајмо о њима укратко.

1. Гауссиан: Гауссиан Наиве Баиес Алгоритам претпоставља да се непрекидне вредности које одговарају свакој карактеристици расподељују према Гауссовој дистрибуцији која се такође назива и нормална дистрибуција.

Претпоставља се да је вероватноћа или претходна вероватноћа предвиђања дате класе Гауссова, па се условна вероватноћа може израчунати као:

2. Мултиномуал: Фреквенције појаве одређених догађаја представљених помоћу вектора карактеристика генеришу се употребом мултиномалне дистрибуције. Овај се модел широко користи за класификацију докумената.

3. Берноулли: У овом моделу уноси су описани функцијама које су независне бинарне променљиве или Боолеанс. Ово се такође широко користи у класификацији докумената као што су Мултиномиал Наиве Баиес.

Можете користити било који од горе наведених модела према захтевима за руковање и класификацију скупа података.

Гауссов модел можете изградити употребом Питхон-а разумевањем примера датог у наставку:

Шифра:

from sklearn.naive_bayes import GaussianNB import numpy as np a = np.array((-2, 7), (1, 2), (1, 5), (2, 3), (1, -1), (-2, 0), (-4, 0), (-2, 2), (3, 7), (1, 1), (-4, 1), (-3, 7))) b = np.array((3, 3, 3, 3, 4, 3, 4, 3, 3, 3, 4, 4, 4)) md = GaussianNB() md.fit (a, b) pd = md.predict (((1, 2), (3, 4))) print (pd)

Излаз:

((3, 4))

Закључак

У овом чланку смо детаљно научили концепте алгоритма наивног Баиеса. Најчешће се користи у класификацији текста. Лако је имплементирати и брзо извршити. Његов главни недостатак је то што захтева да функције морају бити независне, што није истина у стварним апликацијама.

Препоручени чланци

Ово је водич за Алгоритам Наиве Баиеса. Овдје смо разговарали о основном концепту, раду, предностима и недостацима алгоритма наивног Баиеса. Можете и да прођете кроз друге наше предложене чланке да бисте сазнали више -

Јачање алгоритма
Алгоритам у програмирању
Увод у алгоритам

Наиве Баиесов алгоритам - Како то ради - Основни модели - Предности

Преглед садржаја:

Шта је алгоритам Наиве Баиес-а?

Како функционира алгоритам Наиве Баиес-а?

За што се користи алгоритам Наиве Баиес-а?

Предности алгоритма Наиве Баиес

Недостаци алгоритма Наиве Баиес

Како изградити основни модел користећи алгоритам Наиве Баиес-а

Закључак

Препоручени чланци

Мидранге Формула - Како израчунати средњи опсег (примери, калкулатор)

Невероватни концепт Мапе ума - Муст Реад (Водич за лутке)

Алат за развој мобилних апликација - Корисни алат за развој мобилних апликација

Алатке за мобилне апликације које свако мора да користи у индустрији - едуЦБА

МИРР у Екцелу (формула, примери) - Како се користи МИРР функција?

Пхотосхоп ЈПЕГ компресија и квалитет слике

72 мит о резолуцији екрана за веб и екран

Како да промијените величину слика за испис помоћу Пхотосхопа

Црно-беле претворбе Пхотосхоп-а - Десатуратинг Тхе Цолор Туториал

Како изрезати слике у облику круга помоћу Пхотосхопа

Линук Филе Пермиссионс - Врсте дозвола - Напредне дозволе

Линук Минт вс Убунту - Научите кључне разлике између Линук Минт и Убунту-а

Линук дистрибуције - Линук Дистрос за програмере и програмере

Линук Оператори - Свеобухватни водич за највише Линук операторе

ЛИНЕСТ ин екцел (формула, примери) - Како се користи ЛИНЕСТ функција?