Увод у Интервју питања и одговоре на инжењере података

Инжењеринг података је термин у коме су сви свесни и прилично је популаран у области Биг Дата. Инжењеринг података односи се на инфраструктуру података или архитектуру података. Сирови подаци генерисани из различитих извора као што су друштвени медији, мобилни телефони, ввв (интернет) морају се трансформисати, очистити, профилисати и објединити за пословне потребе. Ови необрађени подаци такође се називају Дарк Дата. Пракса дизајнирања, архитектуре и примене система за обраду података помаже у претварању података у део одговарајуће информације или скупа података, такве информације или скупови података називају се Дата Енгинееринг.

Испод је листа најбољих питања и одговора на интернетски инжењер за 2019. годину:

Ако тражите посао који је повезан са Дата Енгинеер-ом, морате се припремити за питања о интервјуу за инжењер података за 2019. годину. Иако су сва питања о интервјуу са инжењером података различита, а опсег посла је такође различит, можемо вам помоћи око најбољих питања о интервјуу са инжењером података са одговорима, који ће вам помоћи да скочите и постигнете успех у свом Дата Енгинеер Интервјуу.

1. Шта је инжењеринг података?

Одговор:
Инжењеринг података је појам који је прилично популаран у пољу великих података и углавном се односи на инфраструктуру података или архитектуру података.
Подаци које генеришу многи извори попут друштвених медија, мобилних телефона, ввв (интернета) су сирови подаци. Треба га трансформисати, очистити, профилисати и објединити за пословне потребе. Ове сирове податке можемо назвати Дарк Дата, на којима ћемо упалити светло да би ови Дарк Дата били корисни. Пракса дизајнирања, архитектуре и примене система за обраду података који ће помоћи да се подаци претворе у корисне информације назива се Дата Енгинееринг.

2. Објасните свакодневни рад инжењера података?

Одговор:
Дневни посао инжењера података састоји се од:
а. руковање управљањем подацима унутар организације
б. руковање и одржавање изворних система података и подручја приказивања
ц. обављање ЕТЛ или ЕЛТ и трансформација података
д. поједностављивање чишћења података и побољшање дуплицирања и стварања података
е. прављење адекватних података за прикупљање података и њихово вађење
Погледајте доњу визуализацију која информише о стварима на којима ради инжењер података: -

3. Да ли имате искуства са моделирањем података?

Одговор:
Може се рећи да је радио на пројекту за клијента за финансијско / здравствено осигурање где су користили ЕТЛ алате као што су Информатица / Таленд / Пентахо итд. За трансформацију и обраду података преузетих из МиСКЛ / РДС / СКЛ базе података и послали их пошаљите ове информације добављачима који могу помоћи повећању њихових прихода. Може се приказати испод архитектуре модела података на високом нивоу. Састоји се од примарног кључа, ентитета, атрибута, односа, ограничења итд.

4. Које су различите врсте шема дизајна у моделирању података? Објасните примером?

Одговор:
Постоје две врсте шема у моделирању података:
а. Звездана шема
Ова шема је подељена на две: једна је табела чињеница, а друга је табела са димензијама где су све табеле са димензијама повезане у табелу чињеница. Страни кључ се у ствари односи на примарне кључеве присутне у димензионалним табелама. Погледајте ниже архитектуру звездане шеме:

б. Схема сњежних пахуљица
У овој схеми је ниво нормализације повећан, овде ће табела чињеница остати иста као код схеме звезда, овде су табеле са димензијама нормализоване. Због многих слојева табела са димензијама, изгледа као снежна пахуљица, чиме је и добила назив схема пахуљица. Погледајте испод архитектуре: -

5. Који ЕТЛ алат користите и на који начин је то најбоље упоредити са другима?

Одговор:
Може се рећи да је он / она користио Информатицу као ЕТЛ алат због многих бодова, прво и најважније је да је по Гартнер Магиц Куадрант-у за алате за интеграцију података Информатица позиционирана као лидер већ десету годину заредом. Једноставан је за употребу и учење, а има могућности повезивања са различитим низом изворних података и типова података, компонентама за поновно коришћење и функцијама које га чине најпопуларнијим за програмере ЕТЛ-а. Такође има сопствени планер који је још једна предност, где други ЕТЛ алати морају да користе спољни планер да би заказали задатке.

6. Које технологије / програмски језик треба да има / Научите да бисте били инжењер података?

Одговор:
Математика (линеарна алгебра и вероватноћа)
Статистика (збирна статистика)
Технике машинског учења
Р и САС језици
СКЛ базе података, Хиве КЛ
Питхон (углавном се користи)
Поред њих, треба имати и знање о решавању проблема, аналитичко и архитектонско знање о бази података.

7. Са којим уобичајеним проблемима се суочавају инжењери података?

Одговор:
1. Интеграција у реалном времену / Континуирана интеграција
2. Похрањивање огромне количине података је једно питање, а информације из тих података су друге.
3. Који се алати могу користити који ће дати најбоље перформансе, складиштење, ефикасност и резултате.
4. Да ли скала складиштења? Претпоставимо како знати да ће обрада читавог скупа података потрајати?
5. С обзиром на конфигурацију процесора и РАМ-а
6. Како изаћи на крај са грешкама, постоји ли толеранција на грешке или не?

8. По чему се архитект података разликује од Инжењера података?

Одговор:
Архитекта података је особа која управља подацима, посебно када се бави различитим бројем различитих извора података. Требало би да имате детаљно знање о томе како база података ради, како се подаци односе на пословне проблеме и како ће промене ометати употребу података организације, а затим ће архитекта података манипулирати / трансформисати архитектуру података у складу са њима.
Главна одговорност Дата Арцхитецт-а је рад на складиштењу података, развоју архитектуре података или предузећа / складишта података предузећа.
Док Дата Датаер помаже у инсталирању решења за складиштење података, моделирању података, развоју и тестирању архитектуре база података.

9. Опишите време када сте пронашли нови случај коришћења постојеће базе података који је имао позитиван утицај на посао?

Одговор:
Док у ери великих података који имају СКЛ недостају следеће функције:
а. РДБМС су ДБ оријентисани шемама, тако да је боље за структуриране податке, а не за полуструктуриране или неструктуриране податке.
б. Није у могућности да обрађује непредвидиве и неструктуриране податке.
ц. То није хоризонтално скалабилно, тј. Паралелно извршавање и чување није могуће у СКЛ-у.
д. Трпи проблем са перформансама након што се повећава број корисника.
е. Користи се углавном за онлине трансакцију.

Да бисмо превазишли ове недостатке, можемо користити НоСКЛ ДБ тј. Не само СКЛ.
Дакле, у пројекту се могу користити различите врсте НоСКЛ ДБ као што су Цассандра, Монго ДБ, Грапх ДБ, ХБасе итд.

10. Имате ли искуства у раду у облаку рачунарског окружења? Које предности видите у раду једног?

Одговор:
Може се рећи да је окружење Цлоуд Цомпутинг спремно да пресели окружење за производњу, развој и тестирање без размишљања о интегрисању многих инстанци / Линук / виндовс сервера заједно. На тржишту постоје различите услуге рачунарског облака попут АВС (Амазон веб сервиси), Азуре (Мицрософт), ГЦП (Гоогле Цлоуд Платформ). Услуга рачунарских услуга у облаку пружа испод функције као што су флексибилност, тј. Окружење ће се повећавати према захтевима, опоравак од катастрофе прављењем резервних копија и снимака, радом с било ког места са ВПН-ом, безбедним окружењем и еколошким окружењима, јер ради на робном хардверу тј. Рачунарима опште намене који су ниске цене.

Закључак

На горњем блогу смо задржали најчешћа питања о интервјуу за Дата Енгинеер и како на то можете одговорити давањем бодова са карактеристикама.

Препоручени чланак:

Ово је свеобухватан водич за питања и одговоре за инжењере података како би кандидат могао лако да разбије ова питања за инжењере података. овај чланак се састоји од свих главних питања и одговора на интервју за инжењере података. Такође можете погледати следеће чланке да бисте сазнали више -

  1. Најважнији Азуре Паас вс Иаас
  2. Биг Дата питања за интервју
  3. 5 најважнијих питања о интервјуу са еластичном претрагом
  4. Питања и одговори за ПИГ интервју
  5. Топ 5 највреднијих питања о интервјуу за науку о подацима