Једносмерна анализа варијансе

Анализа варијанце написана кратко као АНОВА је поступак помоћу којег можемо упоређивати средства у три или више популација. Статистички гледано, постављамо две хипотезе, нулту хипотезу: „Сва средства становништва су једнака“ и алтернативна хипотеза: „Нису сва средства становништва једнака“. Омогућује нам да тестирамо једнакост вишеструких средстава у једном тесту, а не да упоређујемо два средства у исто време, што је неизводљиво када постоји неколико група. У овој теми ћемо сазнати о АНОВА у једном смеру у Р.

Једносмјерна анализа варијанце помаже нам у анализирању само једног фактора или варијабле. На примјер, постоји пет регија и желимо провјерити јесу ли дневне просјечне кише за свих пет регија једнаке или су различите. У овом случају, постоји само један фактор који је регија, јер морамо да проверимо да ли регионални фактори утичу на пријем падавина и образац.

Претпоставке анализе варијанце

Следе претпоставке које морају бити испуњене за примену једносмерне АНОВА:

  • Популације из којих се узимају узорци се обично расподељују.
  • Популације из којих се узимају узорци имају исту варијанцу или стандардно одступање.
  • Узорци из различитих популација су случајни и неовисни.

Како функционира једносмерна АНОВА у Р?

За нашу демонстрацију користимо податке који садрже две варијабле, односно. Бренд и продаја. Постоје четири марке - АТБ, ЈКВ, МКЛ и ПРК. Мјесечне продаје за ове марке се дају. Морамо проверити да ли је просечна продаја код четири марке једнака или се разликују једна од друге. Да бисмо то верификовали, користићемо једносмерну АНОВА. Корак-по-корак поступак примене АНОВА-е је следећи:

  1. Прво увезите податке у Р. Подаци су присутни у ЦСВ формату. Дакле, да бисмо га увезли, користићемо функцију реад.цсв ().

  1. Погледајте првих неколико записа података. Ово је важно да проверимо да ли су подаци исправно увежени у Р. Слично томе, применићемо резиме () функцију на податке, како бисмо добили основне увиде у податке.

  1. Сваки пут када користимо променљиве присутне у скупу података, морамо изричито поменути име скупа података као што су бранд_салес_дата $ Бранд или бранд_салес_дата $ Салес. Да бисмо то превазишли, употребићемо функцију везаности. Функција се мора применити на следећи начин.

  1. Спојимо продају по марки користећи средњу или стандардну девијацију. Агрегација нам помаже да добијемо основну идеју о подацима.

Горњи резултат показује да средства за четири различите групе нису једнака. ЈКВ има највећу средњу продају.

Као што се може видети горе, стандардна одступања у четири групе не показују неку значајну разлику и она је највећа за марку МКЛ.

  1. Сада ћемо применити АНОВА за потврду да ли су средства у три популације једнака или постоји разлика.

Из горњих резултата можемо видети да је АНОВА тест за Марку значајан због п <0.0001. Можемо да протумачимо да све марке немају исте нивое преференција на тржишту што утиче на продају тих марки на тржишту. То би могло бити последица многих фактора и допадања људи за одређену марку.

  1. Горњи резултат може се визуализовати и олакшава интерпретацију. За то ћемо користити плотмеанс () функцију у библиотеци гплотс (). Делује као испод:

Као што видимо горе, функција плотмеанс () у гплотс пакету омогућава нам да визуелно упоредимо средства различитих група. Видимо да средства нису иста код четири марке. Међутим, средства за марке МКЛ и ПРК спадају изблиза.

  1. Горња анализа помаже нам да проверимо да ли брендови имају једнака средства или не, међутим, отежавање упоређивања са паром је тешко с њим. Можемо направити поређења у поређењу за различите марке користећи ТукеиХСД () функцију која олакшава проверу да ли се марка значајно разликује од било које од преосталих.

Упоређивање у пару као горе. Разлика између било које две групе је значајна ако је п <0, 001. Као што видимо горе, п-вредност за пар ПРК-МКЛ је много већа што указује да се две марке не разликују значајно једна од друге.

Да бисмо визуализовали поређене поређења, на основу горњих резултата цртаћемо следеће:

Прва парна функција ротира налепнице оса чинећи их хоризонталним, а друга изјава пар прилагођава рубове тако да се налепнице правилно уклапају, у супротном ће изаћи из екрана.

Горњи граф нуди добар увид, али резултате можемо обликовати у облику бокплота како бисмо добили бољи увид за јаснију интерпретацију као што је приказано у наставку.

Горхт функција () се користи са свеобухватним сетом метода за поређење вишеструких средстава. Напомена, опција нивоа у функцији цлд () односи се на ниво значајности, нпр. Поузданост 0, 05 или 95 одсто)

Коришћењем горње завере постаје лако упоредити средства по групама, а такође олакшава и систематско тумачење. За сваку марку постоје писма, на врху парцеле. Ако две марке имају исто слово, онда немају значајно различита средства као марке МКЛ и ПРК у овом случају које имају исто слово б.

  1. До сада, имплементирали смо АНОВА и користили парцеле за визуелизацију резултата. Међутим, једнако је важно тестирати претпоставке. Прво ћемо потврдити претпоставку нормалности.

Ауто пакет у Р-у пружа функцију ккПлот (). Горња парцела показује да подаци потпадају у оквир 95% поузданости. То указује да је претпоставка нормалности скоро испуњена.

Затим ћемо потврдити да ли су одступања по марки једнака. За то ћемо користити Бартлеттов тест

П-вредност показује да се одступања у групи не разликују значајно

И последње, али не најмање битно, проверићемо да ли постоје људи који утичу на резултате АНОВА-е.

Из горњег резултата можемо видети да у подацима нема назнака о потрошњи (НА се јавља када п> 1)

Узимајући у обзир резултате КК Плот-а, Бартлетт-овог и Оутлиер-овог теста, можемо рећи да подаци испуњавају све претпоставке АНОВА-е и да су добијени резултати валидни.

Закључак - Један смјер АНОВА у Р

АНОВА је врло згодна статистичка техника која се може користити за поређење средстава у више популација. Р нуди свеобухватан асортиман пакета за имплементацију АНОВА, добијање резултата и потврђивање претпоставки. У Р, статистички резултати могу се интерпретирати у визуелним формама које нуде дубље увиде.

Препоручени чланци

Ово је водич за Једносмерни АНОВА у Р. Овде смо расправљали о начину на који једносмерна АНОВА делује и претпоставкама анализе варијанце. Можда ћете такође погледати следеће чланке да бисте сазнали више -

  1. Р Програмски језик
  2. Регрессион вс АНОВА
  3. Како тумачити резултате користећи АНОВА тест
  4. ГЛМ у Р

Категорија: