Увод у мултиваријантну регресију
- Израз у мултиваријату значи модел са више од једне променљиве
- Мултиваријантна регресија део је мултиваријантне статистике.
- Мултиваријантна регресија је техника која се користи за процену појединачног регресијског модела када постоји више од једне променљиве исхода.
- Мултиваријантна регресија најчешће користи алгоритам машинског учења који је алгоритам надзираног учења.
Зашто појединачни регресијски модел неће радити?
- Као што је познато да се регресијска анализа углавном користи за истраживање односа између зависне и независне променљиве.
- У стварном свету постоји много ситуација у којима многе независне променљиве утичу од стране других променљивих за које морамо да пређемо на различите опције него на један регресијски модел који може узети само једну независну променљиву.
Шта је мултиваријантна регресија?
- Мултиваријантна регресија помаже код мерења угла више од једне независне променљиве и више од једне зависне променљиве. Проналази однос између променљивих (Линеарно сродних).
- Користила се за предвиђање понашања променљиве исхода и асоцијације променљивих предиктора и како се променљиве предиктор разликују.
- Може се применити у многим практичним областима као што су политика, економија, медицина, истраживачки радови и разне пословне врсте.
- Мултиваријантна регресија је просто проширење вишеструке регресије.
- Вишеструка регресија користи се за предвиђање и размену вредности једне променљиве на основу збирне вредности више од једне вредности променљивих предвиђања.
- Прво ћемо узети пример за разумевање коришћења мултиваријантне регресије након чега ћемо тражити решење за то питање.
Примери мултиваријантне регресије
- Ако је компанија за е-трговину прикупила податке својих купаца као што су старосна доб, историја купљеног купца, пол и компанија, желе да пронађу однос између ових зависних и независних променљивих.
- Тренер теретане прикупио је податке свог клијента који долазе у његову теретану и желе да примете неке ствари клијента, а то су здравље, прехрамбене навике (које врста клијента конзумира сваке недеље), тежина клијента. Овиме се жели наћи однос између ових променљивих.
Као што сте видели у претходна два примера, да у обе ситуације постоји више од једне променљиве, а неке су зависне, а неке су независне, па ни једна регресија није довољна за анализу ове врсте података.
Ево мултиваријантне регресије која се појављује у слици.
1. Избор функција -
Избор карактеристика игра најважнију улогу у мултиваријантној регресији.
Проналажење функције која је потребна за проналажење варијабле која зависи од ове карактеристике.
2. Нормализирајуће карактеристике -
За бољу анализу потребно је смањити карактеристике да би се оне довеле у одређени опсег. Такође можемо променити вредност сваке функције.
3. Изаберите функцију губитка и хипотезу -
Функција губитка израчунава губитак када хипотеза предвиђа погрешну вредност.
А хипотеза значи предвиђену вредност променљиве карактеристике.
4. Подесите параметре хипотезе -
Поставите параметар хипотезе који може смањити функцију губитака и може предвидјети.
5. Смањите функцију губитка-
Минимизирање губитка коришћењем неког алгоритма минимизирања губитака и употреба га преко скупа података који може помоћи у подешавању параметара хипотезе. Једном када се губитак сведе на минимум, тада се може користити за предвиђање.
Постоји много алгоритама који се могу користити за смањење губитака, попут пада градијента.
6. Испитајте функцију хипотезе -
Проверите функцију хипотезе колико тачно предвиђа вредности, тестирајте је на тестним подацима.
Кораци за праћење архива Мултиваријантна регресија
1) Увозите потребне заједничке библиотеке као што су нумпи, пандас
2) Прочитајте скуп података користећи библиотеку панда
3) Као што смо горе расправљали, морамо да нормализујемо податке за постизање бољих резултата. Зашто нормализација јер свака карактеристика има различит распон вредности.
4) Направите модел који може архивирати регресију ако користите линеарну регресију користећи једначину
И = мк + ц
У којем је к дан улаз, м је косо линија, ц је константна, и је излазна варијабла.
5) Тренирајте модел користећи хиперпараметар. Схватите да је хиперпараметар постављен према моделу. Као што су стопа учења, епохе, итерације.
6) Као што је горе речено како хипотеза игра важну улогу у анализи, проверава хипотезу и мери функцију губитка / трошкова.
7) Функција губитка / трошка помоћи ће нам да измеримо колико је вредност хипотезе тачна и тачна.
8) Смањивање функције губитка / трошкова помоћи ће моделу да побољша предвиђања.
9) Једнаџба губитака може се дефинисати као збир квадратне разлике између предвиђене вредности и стварне вредности подељене двоструко већом од величине скупа података.
10) Да би се минимизирао губитак / трошак функција користи градијент спуштања, започиње са случајном вредношћу и проналази тачку за коју је функција губитка најмање.
Слиједећи горе наведено, можемо имплементирати мултиваријантну регресију
Предности мултиваријантне регресије
- Мултиваријантна техника омогућава проналажење односа између променљивих или карактеристика
- Помаже у проналажењу повезаности између независних и зависних варијабли.
Дис Предности мултиваријантне регресије
- Мултиваријантне технике су мало сложен и математички прорачун високог нивоа
- Излаз мултиваријантног регресијског модела није лако интерпретирати, а понекад зато што неки резултати губитака и грешака нису идентични.
- Не може се применити на мали скуп података јер су резултати у већим сетовима података једноставнији.
Закључак - Мултиваријантна регресија
- Главна сврха коришћења мултиваријантне регресије је када имате више од једне променљиве и у том случају појединачна линеарна регресија неће радити.
- Реални свет углавном има више променљивих или карактеристика када се користе више варијабле / карактеристике у игри мултиваријантна регресија.
Препоручени чланци
Ово је водич за мултиваријантну регресију. Овде смо расправљали о Уводу, примерима мултиваријантне регресије, заједно са Предности и Дис Предности. Можете и да прођете кроз друге наше предложене чланке да бисте сазнали више -
- Регресиона формула
- Дата Сциенце Цоурсе у Лондону
- САС Операторс
- Техника науке о подацима
- Варијабле у ЈаваСцрипт-у
- Главне разлике регресије и класификације