Увод у Питхон Пандас ДатаФраме

На мрежи се могу наћи многа проширења за Питхон Либрари, Пандас. Један од таквих је Подаци на плочи (пан) (дас). Ова реч, * Панел * суптилно наговештава дводимензионалну структуру података која постоји у овој библиотеци, неизмерно оснажујући своје кориснике. Оваква структура се назива ДатаФраме.

То је у основи матрица редака и ступаца, која садржи цео ваш скуп података, са врло детаљним опцијама индексирања истих. ДатаФраме (ДФ) може се замислити сликовито врло сличним екцел листу. Али оно што га чини моћним је лакоћа помоћу које се аналитичке и трансформацијске операције могу изводити на подацима похрањеним у ДатаФраме-у.

Шта је тачно ДатаФраме Питхон Пандас-а?

На страници Пидата може се упутити за нешто са службеном дефиницијом.

Ако се правилно разуме, ДатаФраме спомиње као ступасту структуру, која је способна похранити било који објект Питхон (укључујући и сам ДатаФраме) као једну ћелијску вриједност. (Ћелија је индексирана помоћу јединствене комбинације реда и ступаца)

ДатаФрамес се састоји од три основне компоненте: података, редака и ступаца.

  • Подаци: Односи се на стварне објекте / ентитете похрањене у ћелији у ДатаФраме-у и на вредности које представљају ови ентитети. Објект је било ког ваљаног типа података питхон-а, било да је уграђен или кориснички дефинисан.
  • Редови: Референце које се користе за идентификацију (или индексирање) одређеног скупа опажања из комплетних података похрањених у ДатаФраме-у називају се као редови. Да би то било јасно, он користи употријебљене индексе, а не само податке у одређеном проматрању.
  • Ступци: Референце које се користе за идентификацију (или индексирање) скупа атрибута за сва опажања у ДатаФраме-у. Као и у случају редова, они се односе на индекс ступаца (или заглавља ступаца) уместо на само податке у колони.

Дакле, без икаквог додатног дивљања, испробајмо неке начине стварања ових страшно моћних структура.

Кораци за прављење података Питхон Пандас ДатаФрамес

ПиФон Пандас ДатаФраме се може креирати коришћењем следеће имплементације кода,

1. Увоз панде

Да бисте креирали ДатаФрамес, библиотеку панде треба увести (овде не изненађује). Увезићемо га са псеудонимом пд за референцу објеката у модулу.

Шифра:

import pandas as pd

2. Израда првог ДатаФраме објекта

Једном када се библиотека увози, све методе, функције и конструктори доступни су у вашем радном простору. Дакле, покушајмо да креирамо ДатаФраме ванилије.

Шифра:

import pandas as pd
df = pd.DataFrame()
print(df)

Излаз:

Као што је приказано на излазу, конструктор враћа празан ДатаФраме.
Сада ћемо се фокусирати на креирање ДатаФрамес-а из података похрањених у неким вјероватним репрезентацијама.

  • ДатаФраме из речника: Рецимо да имамо речник који чува списак компанија у Софтваре Домаин-у и број година у којима су активне.

Шифра:

import pandas as pd
df = pd.DataFrame(
('Company':('Google', 'Amazon', 'Infosys', 'Directi'),
'Age':('21', '23', '38', '22') ))
print (df)

Погледајмо репрезентацију враћеног ДатаФраме објекта штампањем на конзоли.

Излаз:

Као што се може видјети, сваки кључ рјечника третира се као ступац у ДатаФраме-у, а индекси редова аутоматски се генерирају почевши од 0. Прилично лако!

Рецимо сада да сте му желели дати прилагођени индекс уместо 0, 1, .. 4. Само морате да пошаљете жељену листу као параметар конструктору и панде ће учинити неопходним.

Шифра:

df = pd.DataFrame(
('Company':('Google', 'Amazon', 'Yahoo', 'Infosys', 'Directi'),
'Age':('21', '23', '24', '38', '22') ),
index=('Alpha', 'Beta', 'Gamma', 'Delta'))
print(df)

Излаз:

Компанија доба
Алпха Гоогле 21
Бета Амазон 23
Гамма Инфосис 38
Делта Дирецти 22

Сада можете поставити индексе реда на било коју жељену вриједност.

  • ДатаФраме из ЦСВ датотеке: Креирајмо ЦСВ датотеку која садржи исте податке као у случају нашег речника. Назовимо датотеку ЦомпаниАге.цсв

Гоогле, 21
Амазон, 23
Инфосис, 38
Дирецти, 22

Датотека се може учитати у оквир података (под претпоставком да постоји у тренутном радном директорију) на следећи начин.

Шифра:

csv_df = pd.read_csv(
'CompanyAge.csv', names=('Company', 'Age'), header=None)
print(csv_df)

Излаз:

Компанија доба
0 Гоогле 21
1 Амазон 23
2 Инфосис 38
3 Дирецти 22

Постављање имена параметара , заобилазећи списак вредности, додељује их као заглавља ступаца истим редоследом којим су присутни на листи. Слично томе, индекси редова могу се поставити преношењем листе параметру индекса, као што је приказано у претходном одељку. Заглавље = Ништа не означава заглавље ступаца у датотеци података.

Рецимо сада да су имена ступаца била део датотеке података. Тада ће подешавање заглавља = Фалсе извршити тражени посао.

3. ЦомпаниАгеВитхХеадер.цсв

Компанија, год
Гоогле, 21
Амазон, 23
Инфосис, 38
Дирецти, 22

Кодекс ће се променити у

csv_df = pd.read_csv(
'CompanyAgeWithHeader.csv', header=False)
print(csv_df)

Излаз:

Компанија доба
0 Гоогле 21
1 Амазон 23
2 Инфосис 38
3 Дирецти 22

  • ДатаФраме из датотеке Екцел: Подаци се често деле у екцел датотекама јер су то најпопуларнији алат који обични људи користе за Адхоц праћење. Дакле, наша дискусија не би требало занемарити.

Претпоставимо да су подаци, исти као у ЦомпаниАгеВитхХеадер.цсв, сада похрањени у ЦомпаниАгеВитхХеадер.клск, на листу с именом Цомпани Аге. Исти ДатаФраме као горе ће бити креиран следећим кодом.

Шифра:

excel_df= pd.read_excel('CompanyAgeWithHeader.xlsx', sheet_name='CompanyAge')
print(excel_df)

Излаз:

Компанија доба
0 Гоогле 21
1 Амазон 23
2 Инфосис 38
3 Дирецти 22

Као што видите, исти ДатаФраме може се креирати преношењем имена датотеке и назива листа.

Даље читање и наредни кораци

Приказане методе представљају веома мали подскуп у односу на све различите начине на које се могу створити ДатаФрамес. Они су створени са намером да се започне. Свакако би требали истражити наведене референце и покушати истражити друге начине, укључујући повезивање с базом података како бисте директно прочитали податке у ДатаФраме.

Закључак

Пандас ДатаФраме показао се као измењивач игара у свету Дата Сциенце и Дата Аналитицс, као и погодан је за ад хоц краткорочне пројекте. Долази са армијом алата који могу да сецкају и бришу скуп података изузетно лако. Надамо се да ће ово послужити као одскочна даска на вашем путовању.

Препоручени чланци

Ово је водич за Питхон-Пандас ДатаФраме. Овде смо расправљали о корацима за креирање података питхон-пандас, заједно са његовом имплементацијом кода. Такође можете погледати следеће чланке да бисте сазнали више -

  1. Топ 15 карактеристики Питхона
  2. Различите врсте Питхон сетова
  3. Топ 4 врсте променљивих у Питхон-у
  4. Топ 6 Едиторс оф Питхон
  5. Низови у структури података

Категорија: