Разлика између регресије и класификације

У овом чланку Регресија вс класификација, размотримо кључне разлике између регресије и класификације. Машинско учење је широко подељено на две врсте, а то су Надгледано машинско учење и Ненадзоровано машинско учење. У надзираном машинском учењу имамо познату излазну вредност у скупу података и тренирамо модел на основу њих и користимо га за предвиђање док код ненадзираног машинског учења немамо познати скуп излазних вредности. Унапред да бисмо разликовали Класификацију и Регресију, разумемо шта та терминологија значи у Машинском учењу. Регресија је алгоритам у стројном учењу под надзором који се може обучити за предвиђање стварних бројева. Класификација је алгоритам у надгледаном машинском учењу који се обучава да идентификује категорије и предвиђа у коју категорију ће потпасти нове вредности.

Упоређивање регресије против класификације (Инфограпхицс)

Испод је топ 5 поређења између регресије и класификације :

Кључне разлике између регресије и класификације

Расправимо о неким кључним разликама између регресије и класификације у следећим тачкама:

  1. Класификација се односи на предвиђање етикете или категорије. Алгоритми за класификацију класификују тражени скуп података у једну од две или више ознака, алгоритам који се бави две класе или категорије познат је као бинарни класификатор, а ако постоји више од две класе, онда се може назвати алгоритмом класификације више класа.
  2. Регресија је у проналажењу оптималне функције за препознавање података континуираних стварних вриједности и предвиђање те количине. Регресија са више варијабли као улаза или карактеристика за тренирање алгоритма позната је као мултиваријантни регресијски проблем. Ако су у случају проблема са регресијом улазне вредности зависне или одређени временом, то је познато као проблем предвиђања временских серија.
  3. Међутим, класификациони модел ће такође предвидјети континуирану вредност која је вероватноћа да ће се догодити догађај који припада тој одређеној излазној класи. Овде вероватноћа догађаја представља вероватноћу далог примера који припада одређеној класи. Предвиђена вредност вероватноће може се претворити у вредност класе одабиром ознаке класе која има највећу вероватноћу.
  4. Да разумемо боље ако видимо пример, претпоставимо да тренирамо модел да предвидимо да ли особа има рак или не на основу неких карактеристика. Ако добијемо вероватноћу да ће особа имати рак као 0.8, а не да има рак као 0.2, можемо претворити 0.8 вероватноћу у класу ознаке која има рак јер има највећу вероватноћу.
  5. Као што је горе поменуто у класификацији, да бисмо видели колико је квалитетан модел класификације, израчунавамо тачност. Да видимо како се израчунава, тачност у класификацији може се извршити узимајући омјер тачних предвиђања и укупних предвиђања помножених са 100. Ако је направљено 50 предвиђања и 10 их је тачно, а 40 је нетачно, тачност ће бити 20 %.

Тачност = (Број тачних предвиђања / Укупан број предвиђања) * (100)

  • Тачност = (10/50) * (100)
  • Тачност = 20%
  1. Као што је горе споменуто у регресији, да бисте видели колико добро регресијски модел делује најпопуларнији начин је израчунавање средње вредности квадратне грешке (РМСЕ). Да видимо како ће се израчунавање извршити.

Предвиђена вредност регресијског модела је 4, 9 док је стварна вредност 5, 3.

Предвиђена вредност регресијског модела је 2, 3 док је стварна вредност 2, 1.

Предвиђена вредност регресијског модела износи 3, 4 док је стварна вредност 2, 9.

Роот значи да се квадратна грешка може израчунати помоћу формуле.

Грешка квадратна је (5.3-4.9) 2 = 0.16, (2.1-2.3) 2 = 0.04, (2.9-3.4) 2 = 0.25

Средња вредност грешке на квадрат = 0, 45 / 3 = 0, 15

Просечна квадратна грешка = квадратни корен од 0, 15 = 0, 38

То је РМСЕ = 0, 38. Постоји много других метода за израчунавање ефикасности модела, али РМСЕ се највише користи јер РМСЕ нуди оцену грешке у истим јединицама као и предвиђена вредност.

Примери:

Већини инжењера података научника тешко је одабрати између регресије и класификације у почетној фази каријере. Да бисмо вам олакшали да видимо како изгледају проблеми са класификацијом и како изгледају регресијски проблеми,

Класификација

  1. Предвиђа да ли ће сутра или не падати киша.
  2. Предвиђање неке особе требало би да купи то добро или да не доноси профит.
  3. Предвиђање да ли особа има болест или не.

Ако примјетите за сваку ситуацију овдје може бити или Да или Не као вриједност предвиђена на излазу.

Регресија

  1. Предвиђање цене земљишта.
  2. Предвиђање цене акција.

Ако приметите за сваку ситуацију овде већина њих има нумеричку вредност као што је предвиђени излаз.

Табела поређења регресије и класификације

Табела у наставку резимира поређења између регресије и класификације :

Параметар Регресија

Класификација

Врста функције мапирањаУ овим алгоритмима ће се мапирати функција која ће бити изабрана типа која може да усклади вредности са континуираним излазом.У овим алгоритмима ће се мапирати функција која ће бити изабрана типа која може да усклади вредности са унапред дефинисаним класама.
Укључује предвиђањеЗа ову врсту алгоритама предвиђени подаци припадају категорији континуираних вриједности.

(Као 23, 34, 45, 67, 28)

За ову врсту предвиђених података алгоритам припада категорији дискретних вриједности.

(Као да или не, припада А или Б или Ц).

Метода израчунаРоот Средња квадратна грешка ће се израчунати да би се идентификовало најбоље постављање скупа података.Точност ће се израчунати да би се утврдило најбоље стапање података.
Природа предвиђених податакаПрирода предвиђених података је одређена. (То су предвиђене вредности биће у неком низу).Природа предвиђених података није уређена. (То су предвиђене вредности неће бити ни у једном редоследу).
АлгоритмиПодржава векторска регресија и регресијска стабла позната су и као случајна шума, што је један од популарних примера регресијских алгоритама.Наивни Баиес, стабла одлука и К Најближи сусједи неки су од популарних примјера алгоритама за класификацију.

Закључак

Ово су неке од кључних разлика између класификације и регресије. У неким случајевима се континуиране излазне вредности предвиђене регресијом могу груписати у етикете и променити у класификационе моделе. Дакле, морамо јасно схватити кога изабрати на основу ситуације и шта желимо да предвиђени резултати буду.

Препоручени чланци

Ово је водич за главну разлику између регресије и класификације. Овде такође разматрамо кључне разлике између регресије и класификације са инфографиком и упоредном табелом. Можда ћете такође погледати следеће чланке да бисте сазнали више -

  1. Топ 7 типова шифри
  2. Шта је СтрингБуилдер у Ц # са предностима
  3. СтрингБуффер вс СтрингБуилдер | Топ 4 поређење
  4. Најбоље разлике - Јира вс Гитхуб
  5. Шта је регресијска анализа?
  6. Мултиваријантна регресија
  7. Алгоритми класификације
  8. Креирајте стабло одлука са предностима

Категорија: