Разлика између науке и података података
Дата Мининг говори о проналажењу трендова у скупу података. И користећи ове трендове за идентификацију будућих образаца. То је важан корак у процесу откривања знања. То често укључује анализу огромне количине историјских података који су раније игнорисани. Наука података је поље проучавања које обухвата све: Биг Дата Аналитицс, Мининг Дата, Предицтиве Моделлинг, Визуализација података, Математика и Статистика. Дата Сциенце се назива четврта парадигма науке. (остала три су теоријска, емпиријска и рачунарска). Ацадемиа често проводи ексклузивна истраживања у пољу Дата Сциенце.
Историјска перспектива
Пре него што пређемо на технички опис, погледајмо еволуцију појмова. Историјска истрага ће разјаснити како се тренутно користе изрази.
- Реч „Дата Сциенце“ постоји око 1960-их, али се тада користила као алтернатива „Цомпутер Сциенце“. Тренутно носи сасвим друго значење.
- 2008. године, ДЈ Патил и Јефф Хаммербацхер постали су први појединци који су себе називали „Дата Сциентист“ да би описали своју улогу на ЛинкедИн-у и Фацебоок-у.
- У 2012. години чланак Харвард Бусинесс Ревиев-а цитирао је Дата Сциентист као 'најсекси посао у 21. веку'.
- Израз Дата Мининг развијао се паралелно. Превладала је међу заједницама база података у 1990-има.
- Дата Мининг дугује своје порекло КДД (Откривање знања у базама података). КДД је процес проналажења знања из информација које се налазе у базама података. А Дата Мининг је главни подпроцес у КДД-у.
- Дата Мининг се често користи наизменично заједно са КДД.
Иако су та имена настала самостално, често се међусобно надопуњују, пошто су уско повезана са анализом података.
Упоређивање података Дата Сциенце Вс Дата Мининг (Инфограпхицс)
Испод је 9 најбољих поређења података из Дата Сциенце Вс Дата Мининга
Пример употребе случаја
Размислите о сценарију у којем сте главни трговац у Индији. Имате 50 продавница које послују у 10 главних градова Индије и послујете већ 10 година.
Рецимо, желите да проучите податке последњих 8 година да бисте открили број продаја слаткиша током празничних сезона у 3 града. Ако вам је то циљ, препоручио бих вам да запослите особу која има стручност у области рударства података. Минер података би вероватно прошао кроз историјске информације похрањене у наслеђеним системима и користио алгоритме за извлачење трендова.
Размотрите још један случај у којем желите да знате који су слаткиши добили више позитивних критика. У овом случају ваши извори података не могу бити ограничени на базе података, могли би се проширити и на друштвене веб странице или повратне поруке корисника. У овом случају, мој предлог за вас би био да запослите Дата Сциентист. Особа запослена као Дата Сциентист погоднија је за примену алгоритама и спровођење ове социо-рачунарске анализе.
Кључне разлике између Дата Сциенце Вс Дата Мининга
Испод је разлика између науке о подацима и вађења података
- Рударство података је активност која је део ширег процеса откривања знања у базама података (КДД) док је наука података поље проучавања баш као и примењена математика или рачунарска наука.
- На Дата Сциенце се често гледа у широком смислу, док се Дата Мининг сматра нишом.
- Неке активности у оквиру Дата Мининг-а, као што су статистичка анализа, писање протока података и препознавање узорака, могу се пресијецати са Дата Сциенце-ом. Дакле, Дата Мининг постаје подскуп података Сциенце.
- Машинско учење у Рударству података се више користи у препознавању образаца док у Дата Сциенце-у има општију употребу.
Белешка
- Науку података и Дата Мининг не треба бркати са Биг Дата Аналитицс-ом и могу имати и рударе и научнике који раде на великим скупима података.
Табела упоређивања података из области науке о подацима против података
Основе за поређење | Претрага података | Дата Сциенце |
Шта је то? | Техника | Област |
Фокус | Пословних процеса | Научно истраживање |
Циљ | Учините податке употребљивијим | Израда производа усмерених на податке за организацију |
Излаз | Обрасци | Разнолик |
Сврха | Проналажење трендова који претходно нису били познати | Социјална анализа, изградња предиктивних модела, откривање непознатих чињеница и још много тога |
Професионална перспектива | Неко са познавањем навигације кроз податке и статистичким разумевањем може да врши рударјење података | Особа мора да разуме машинско учење, програмирање, инфо-графичке технике и да поседује знање о домену да би постала научник података |
Обим | Ископавање података може бити подскуп података Дата Сциенце-а јер су рударске активности део пројекта Дата Сциенце | Мултидисциплинарна - наука података састоји се од визуализације података, рачунарских друштвених наука, статистике, вађења података, обраде природног језика и тако даље |
Бави се (врстом података) | Углавном структурирани | Сви облици података - структурирани, полуструктурирани и неструктурирани |
Друга мање популарна имена | Археологија података, прикупљање информација, откривање информација, вађење знања | Наука заснована на подацима |
Закључак - Дата Сциенце Вс Дата Мининг
Дакле, ево! Сигуран сам да сте сада више свесни шта су кључне разлике између њих двоје и у којем контексту би их требало користити. Једна ствар коју би требало запамтити је да не постоје формалне и прецизне дефиниције Дата Сциенце и Дата Мининг. Међу академским и индустријским снагама још увек се воде расправе о томе шта је тачна дефиниција. Међутим, сви су на истој страници у погледу разлика на високом нивоу и описа двају термина које смо истражили у овом чланку.
Препоручени чланак
Ово је водич за Дата Дата Вс Мининг Мининг, њихово значење, упоређивање главе до главе, кључне разлике, табела упоређивања и закључак. Такође можете погледати следеће чланке да бисте сазнали више -
- Наука података и њен значај у порасту
- 7 Важних техника вађења података за најбоље резултате
- Предиктивна аналитика у односу на науку података - научите 8 корисних поређења
- 8 Важне технике вађења података за успешно пословање