Шта је алгоритам Наиве Баиес-а?

Наиве Баиесов алгоритам је техника која помаже у конструисању класификатора. Класификатори су модели који класификују проблематичне инстанце и дају им ознаке класе које су представљене као вектори предиктора или вредности својстава. Заснован је на Баиесовој теореми. Назван је наивним Баиесом јер претпоставља да вредност обележја не зависи од другог својства, тј. Промена вредности обележја не би утицала на вредност друге карактеристике. Из истог разлога је називају и идиот Баиес. Овај алгоритам делује ефикасно за велике скупове података, стога је најприкладнији за предвиђања у реалном времену.

Помаже да се израчуна задња вероватноћа П (ц | к) користећи претходну вероватноћу класе П (ц), претходну вероватноћу предиктора П (к) и вероватноћу давања предвиђеног класе, такође названу вероватноћом П (к | ц) ).

Формула или једначина за израчунавање постериорне вероватноће је:

  • П (ц | к) = (П (к | ц) * П (ц)) / П (к)

Како функционира алгоритам Наиве Баиес-а?

Разјаснимо функционирање алгоритма наивног Баиеса користећи примјер. Претпостављамо скуп података о тренингу и временску варијаблу 'Идемо у куповину'. Сада ћемо класификовати да ли ће девојка ићи у куповину на основу временских услова.

Дати скуп података је:

ВеатхерИде у куповину
СунчанНе
Кишнада
Облачнода
Сунчанда
Облачнода
КишнаНе
Сунчанда
Сунчанда
КишнаНе
Кишнада
Облачнода
КишнаНе
Облачнода
СунчанНе

Следећи кораци би били изведени:

Корак 1: Направите табеле фреквенција помоћу скупова података.

ВеатхердаНе
Сунчан32
Облачно40
Кишна23
Укупно95

Корак 2: Направите табелу вероватноће израчунавањем вероватноће сваког временског стања и одласком у куповину.

ВеатхердаНеВероватноћа
Сунчан325/14 = 0, 36
Облачно404/14 = 0, 29
Кишна235/14 = 0, 36
Укупно95
Вероватноћа9/14 = 0, 645/14 = 0, 36

Корак 3: Сада морамо израчунати задњу вероватноћу користећи Наиве Баиесову једначину за сваку класу.

Примјер проблема: Дјевојчица ће ићи у куповину ако је вријеме облачно. Да ли је та изјава тачна?

Решење:

  • П (Да | Облачно) = (П (Облачно | Да) * П (Да)) / П (Облачно)
  • П (Облачно | Да) = 4/9 = 0, 44
  • П (Да) = 9/14 = 0, 64
  • П (облачно) = 4/14 = 0, 39

Сада ставите све израчунате вредности у горњу формулу

  • П (Да | Облачно) = (0, 44 * 0, 64) / 0, 39
  • П (да | облачно) = 0.722

Класа која има највећу вероватноћу био би исход предвиђања. Користећи исте вероватноће приступа могу се предвидјети из различитих класа.

За што се користи алгоритам Наиве Баиес-а?

1. Предвиђање у реалном времену: Алгоритам Наиве Баиеса брз је и увек спреман да научи, па је стога најприкладнији за предвиђања у реалном времену.

2. Предвиђање више класа: Вероватноћа мулти-класе било које циљне варијабле може се предвидјети помоћу алгоритма Наиве Баиес.

3. Систем препорука: Наиве Баиесов класификатор уз помоћ колаборативног филтрирања гради систем препорука. Овај систем користи технике ископавања података и машинског учења како би филтрирао информације које раније нису виђене и затим предвидио да ли ће корисник ценити одређени ресурс или не.

4. Класификација текста / Анализа осећања / Филтрирање нежељене поште: Због својих бољих перформанси код проблема више класе и правила независности, алгоритам Наиве Баиес-а боље ради или има већу успешност у класификацији текста, па се користи у анализи осећаја и Филтрирање нежељене поште.

Предности алгоритма Наиве Баиес

  • Једноставно за имплементацију.
  • Брзо
  • Ако важи претпоставка независности, она функционише ефикасније од осталих алгоритама.
  • Захтијева мање података о обуци.
  • Високо је скалабилна.
  • Може да даје вероватна предвиђања.
  • Може да обрађује и континуиране и дискретне податке.
  • Неосјетљив према небитним особинама.
  • Може се лако радити с недостајућим вредностима.
  • Лако се ажурира по доласку нових података.
  • Најприкладније за проблеме са класификацијом текста.

Недостаци алгоритма Наиве Баиес

  • Снажна претпоставка о карактеристикама да су независне што је тешко тачно у стварним апликацијама.
  • Недостатак података.
  • Шансе за губитак тачности.
  • Нулта фреквенција, тј. Ако се категорија било које категоричке варијабле не види у скупу података о тренинзима, тада модел додељује нултој вероватноћи тој категорији и тада се не може предвидети.

Како изградити основни модел користећи алгоритам Наиве Баиес-а

Постоје три врсте Наиве Баиес модела: Гауссиан, Мултиномиал и Берноулли. Разговарајмо о њима укратко.

1. Гауссиан: Гауссиан Наиве Баиес Алгоритам претпоставља да се непрекидне вредности које одговарају свакој карактеристици расподељују према Гауссовој дистрибуцији која се такође назива и нормална дистрибуција.

Претпоставља се да је вероватноћа или претходна вероватноћа предвиђања дате класе Гауссова, па се условна вероватноћа може израчунати као:

2. Мултиномуал: Фреквенције појаве одређених догађаја представљених помоћу вектора карактеристика генеришу се употребом мултиномалне дистрибуције. Овај се модел широко користи за класификацију докумената.

3. Берноулли: У овом моделу уноси су описани функцијама које су независне бинарне променљиве или Боолеанс. Ово се такође широко користи у класификацији докумената као што су Мултиномиал Наиве Баиес.

Можете користити било који од горе наведених модела према захтевима за руковање и класификацију скупа података.

Гауссов модел можете изградити употребом Питхон-а разумевањем примера датог у наставку:

Шифра:

from sklearn.naive_bayes import GaussianNB
import numpy as np
a = np.array((-2, 7), (1, 2), (1, 5), (2, 3), (1, -1), (-2, 0), (-4, 0), (-2, 2), (3, 7), (1, 1), (-4, 1), (-3, 7)))
b = np.array((3, 3, 3, 3, 4, 3, 4, 3, 3, 3, 4, 4, 4))
md = GaussianNB()
md.fit (a, b)
pd = md.predict (((1, 2), (3, 4)))
print (pd)

Излаз:

((3, 4))

Закључак

У овом чланку смо детаљно научили концепте алгоритма наивног Баиеса. Најчешће се користи у класификацији текста. Лако је имплементирати и брзо извршити. Његов главни недостатак је то што захтева да функције морају бити независне, што није истина у стварним апликацијама.

Препоручени чланци

Ово је водич за Алгоритам Наиве Баиеса. Овдје смо разговарали о основном концепту, раду, предностима и недостацима алгоритма наивног Баиеса. Можете и да прођете кроз друге наше предложене чланке да бисте сазнали више -

  1. Јачање алгоритма
  2. Алгоритам у програмирању
  3. Увод у алгоритам

Категорија: