10 основних питања за интервју са аналитичким подацима (Ажурирано за 2019)

Преглед садржаја:

Anonim

Увод у питања и одговор на интервју за аналитику података

Дакле, коначно сте пронашли посао из снова у услузи Дата Аналитицс, али се питате како разбити интервју за аналитику података из 2019. године и шта би могла бити вероватна питања везана за аналитику података. Сваки интервју са Анализом података је различит и такође је и обим посла. Имајући то у виду, осмислили смо најчешћа питања и одговоре у вези са аналитиком података који ће вам помоћи да постигнете успех у интервјуу за Дата Аналитицс.

Испод је најпопуларнија питања о интервјуу за најбољу анализу података из 2019. године која се углавном постављају у интервјуу

1. Која је разлика између података и анализе података?

Одговор:

Претрага податакаАнализа података
Хипотеза није потребна за истраживање податакаАнализа података започиње хипотезом.
Дата Мининг захтева чисте и добро документоване податке.Анализа података укључује чишћење података.
Резултате вађења података није увек лако интерпретирати.Аналитичари података интерпретирају резултате и презентирају их заинтересованим странама.
Алгоритми за ископавање података аутоматски развијају једнаџбе.Аналитичари података морају да развију сопствене једначине.

2. Спомените који су различити кораци у аналитичком пројекту?

Одговор:
Анализа података бави се прикупљањем, чишћењем, трансформирањем и моделирањем података ради стјецања вриједних увида и подршке бољем доношењу одлука у организацији. Кораци који су укључени у процес анализе података су следећи -

Истраживање података - Истражујући пословни проблем, аналитичар података мора да анализира основни узрок проблема.
Припрема података - У овом кораку процеса анализе података проналазимо аномалије података попут недостајућих вриједности унутар података.
Моделирање података - Корак моделирања започиње након што су подаци припремљени. Моделирање је итеративни процес у којем се модел опетовано изводи ради побољшања. Моделирање података осигурава најбољи могући резултат за пословни проблем.
Валидација - У овом кораку модел који пружа клијент и модел који је развио аналитичар података валидирају се један против другог како би се открило да ли развијени модел испуњава пословне захтеве.
Имплементација модела и праћење - У овом последњем кораку примене модела анализе података се врши и након тога се врши праћење како би се осигурало да се модел правилно примени или не?

3. Која је одговорност аналитичара података?

Одговор:
• Решите питања везана за пословање за клијенте и извршите операције ревизије података.
• Интерпретирати податке користећи статистичке технике.
• Идентификујте подручја за могућности побољшања.
• Анализирати, идентификовати и интерпретирати трендове или обрасце у сложеним скуповима података.
• Набавите податке из примарних или секундарних извора података.
• Одржавајте базе података / системе података.
• Пронађите и исправите проблеме са кодом користећи индикаторе перформанси.
• Обезбеђивање базе података развојем система приступа.

4.Кови су судари таблица шаре? Како се то избегава?

Одговор:
Судар таблице хасх-а догађа се када два различита кључа имају исту вриједност. Постоје многе технике за избегавање судара таблице, овде смо издвојили две:
Одвојено везивање: Користи структуру података која се уклапа у исти утор за смештање више ставки.
Отворено адресирање: Тражи друге слотове помоћу друге функције и спрема ставку у први празни утор.

5. Листа неких најбољих алата који могу бити корисни за анализу података?

Одговор:
• Таблеау
• РапидМинер
• ОпенРефине
• КНИМЕ
• Гоогле претраживачи
• Солвер
• НодеКСЛ
• ио
• Волфрам Алпха
• Гоогле Фусион Табеле

6. Која је разлика између вађења података и профилирања података?

Одговор:
Разлика између вађења података и профилирања података је следећа -
• Профилирање података: Циља на тренутну анализу појединих атрибута попут варирања цена, различите цене и њихове учесталости, учесталости нултих вредности, врсте података, дужине итд.
• Рударство података: фокусира се на зависности, откривање редоследа, држање односа између неколико атрибута, анализу кластера, откривање необичних записа итд.

7. Објасните К-средњи алгоритам и хијерархијски алгоритам кластерирања?

Одговор:
К-средњи алгоритам - К средња вредност је позната метода партиционирања. У алгоритму средње вредности Кластери су сферни, тј. Податковне тачке у кластеру су центриране на том кластеру. Такође, варијанција кластера је слична, односно свака тачка података припада најближем кластеру
Хијерархијски алгоритам кластерирања - Хијерархијски алгоритам кластерирања комбинује и дијели постојеће групе и ствара хијерархијску структуру да би показао редослијед подјеле група.

8.Шта је чишћење података? Спомените неколико најбољих пракси које требате слиједити током чишћења података?

Одговор:
Из одређеног скупа података изузетно је важно сортирати информације потребне за анализу података. Чишћење података је пресудни корак у којем се подаци прегледавају како би се пронашле неправилности, уклониле понављајуће се и нетачне информације итд. Чишћење података не укључује уклањање постојећих података из базе података, већ само побољшава квалитету података како би се могли користити за анализу .
Неке од најбољих пракси чишћења података укључују -
• Развој плана квалитета података да бисте идентификовали где се појављују максималне грешке у квалитету података, тако да можете проценити основни узрок и планирати у складу с тим.
• Следите уобичајену методу доказивања потребних информација пре него што их унесете у податке.
• Идентификујте дупликате података и потврдите тачност података јер ће то уштедети времена током анализе.
• Праћење свих операција побољшања изведених на информацијама је невероватно потребно како бисте поновили или одузели све операције по потреби.

9. Које су неке од статистичких метода корисне за анализу података?

Одговор:
Статистичке методе које су корисне за научника података јесу
• Баиесова метода
• Марков поступак
• Просторни и кластерски процеси
• Статистика рангирања, процента, детекција вањске стране
• Технике импутације итд.
• Симплек алгоритам
• Математичка оптимизација

10. Објасните шта је импутација? Наведи различите врсте техника импутације? Која је метода импутације повољнија?

Одговор:
Током импутације имамо тенденцију да заменимо недостајуће информације замењеним вредностима. Врсте техника импутације укључују -
• Појединачна импутација: Појединачна импутација означава да недостајућа вредност замењује вредност. У овој методи се дохваћа величина узорка.
• Импутација вруће палубе: Недостајећа вредност се приписује случајно одабраном сличном запису помоћу картице ударања
• Имутација хладне палубе: Делује исто као и импутација вруће палубе, али мало је напреднија и бира донаторе из других скупова података
• Средња импутација: укључује замену недостајуће вредности предвиђеним вредностима других променљивих.
• Регресијска импутација: укључује замену недостајуће вредности предвиђеним вредностима одређене вредности, зависно од других променљивих.
• Стохастичка регресија: То је исто као и импутација регресије, али додаје уобичајену регресијску варијансу регресијској импутацији
• Вишеструка импутација: за разлику од појединачне импутације, више импутација процењује вредности више пута

Иако се појединачна импутација увелико користи, она не одражава несигурност створена насумичним недостатком података. Дакле, вишеструка импутација је повољнија од појединачне импутације у случају да подаци насумично нестану.

Препоручени чланци

Ово је свеобухватан водич за Интервју Питања и одговоре за аналитику како би кандидат могао лако да разбије ова питања за Интервју аналитике. Такође можете погледати следеће чланке да бисте сазнали више -

  1. 10 корисних агилних питања и одговора за интервју
  2. 8 Питања за интервју о страшном алгоритму
  3. 25 Најважнија питања из интервјуа о рачунарској науци
  4. 10 невероватних питања и одговора за интервју са инжењером података