Графикони у Р - Врсте графова у истраживачким и примерима са применом

Преглед садржаја:

Anonim

Увод у графиконе у Р

Граф је алат који значајно утјече на анализу. Графикони ретки су важни јер помажу у приказивању резултата на најинтерактивнији начин. Р, као пакет статистичког програмирања, нуди опсежне могућности за генерисање различитих графова.

Неки од графова у Р доступни су у основној инсталацији, али други се могу користити инсталирањем потребних пакета. Јединствена карактеристика графова у Р је та што они објашњавају замршене статистичке налазе визуализацијама. Дакле, у суштини ово је попут померања корака изнад традиционалног начина визуелизације података. Р, дакле, нуди вансеријски приступ анализи вожње.

Врсте графова у Р

Различити графикони су доступни у Р-у, а употребом управља искључиво контекст. Међутим, истраживачка анализа захтева употребу одређених графова у Р који се морају користити за анализу података. Сада ћемо погледати неке од таквих важних графова у Р.

За демонстрацију разних графикона користићемо скуп података "дрвећа" доступних у основној инсталацији. Више детаља о скупу података може се открити помоћу? команда дрвећа у Р.

1. Хистограм

Хистограм је графички алат који ради на једној променљивој. Бројне променљиве вредности су груписане у канте за смеше, а број вредности названих као фреквенција се израчунава. Овај израчун се затим користи за цртање фреквенцијских трака у одговарајућим пасуљима. Висина шипке је представљена фреквенцијом.

У Р- у можемо да користимо функцију хист () као што је приказано у даљем тексту за генерисање хистограма. Једноставни хистограм висине стабала приказан је доле.

Шифра:

hist(trees$Height, breaks = 10, col = "orange", main = "Histogram of Tree heights", xlab = "Height Bin")

Излаз:

Да бисмо разумели тренд фреквенције, можемо додати графикон густоће на горњи хистограм. То нуди више увида у дистрибуцију података, накривљеност, куртозу, итд. Ово чини следећи код, а резултат се приказује иза кода.

Шифра:

hist(trees$Height, breaks = 10, col = "orange",
+ main = "Histogram of Tree heights with Kernal Denisty plot",
+ xlab = "Height Bin", prob = TRUE)

Излаз:

2. Сцаттерплот

Овај заплет је једноставан тип графикона, али врло пресудан који има огроман значај. Табела даје идеју о повезаности међу варијаблама и користан је алат у истраживачкој анализи.

Следећи код генерише једноставну Сцаттерплот графикон. Њима смо додали линију тренда, да бисмо разумели тренд, подаци представљају.

Шифра:

attach(trees)
plot(Girth, Height, main = "Scatterplot of Girth vs Height", xlab = "Tree Girth", ylab = "Tree Height")
abline(lm(Height ~ Girth), col = "blue", lwd = 2)

Излаз:

Графикон креиран следећим кодом показује да постоји добра корелација између опсега и обима стабла.

Шифра:

plot(Girth, Volume, main = "Scatterplot of Girth vs Volume", xlab = "Tree Girth", ylab = "Tree Volume")
abline(lm(Volume ~ Girth), col = "blue", lwd = 2)

Излаз:

Сцаттерплот Матрицес

Р нам омогућава да упоређујемо више варијабли одједном због тога што користи матрице расипања. Имплементација визуелизације је прилично једноставна, а може се постићи коришћењем парова () функције као што је приказано у наставку.

Шифра:

pairs(trees, main = "Scatterplot matrix for trees dataset")

Излаз:

Сцаттерплот3д

Омогућују визуализацију у три димензије, што може помоћи у разумевању односа између више променљивих. Дакле, да бисте расположили расоре у 3Д-у, прво треба да се инсталира паковање растер. Дакле, следећи код генерише 3д граф као што је приказано испод кода.

Шифра:

library(scatterplot3d)
attach(trees)
scatterplot3d(Girth, Height, Volume, main = "3D Scatterplot of trees dataset")

Излаз:

Помоћу доњег кода можемо додати капљиве линије и боје. Сада можемо лако разликовати различите променљиве.

Шифра:

scatterplot3d(Girth, Height, Volume, pch = 20, highlight.3d = TRUE,
+ type = "h", main = "3D Scatterplot of trees dataset")

Излаз:

3. Бокплот

Бокплот је начин визуелизације података путем кутија и вискија. Прво се променљиве вредности сортирају узлазним редоследом, а затим се подаци поделе у четвртине.

Кутија у парцели је средњих 50% података, позната као ИКР. Црна линија у пољу представља медијан.

Шифра:

boxplot(trees, col = c("yellow", "red", "cyan"), main = "Boxplot for trees dataset")

Излаз:

Варијанта сандука са зарезима приказана је доле.

Шифра:

boxplot(trees, col = "orange", notch = TRUE, main = "Boxplot for trees dataset")

Излаз:

4. Лине Цхарт

Линијски графикони су корисни када упоређујете више променљивих. Помажу нам у односу између више варијабли у једној парцели. На следећој илустрацији покушаћемо да разумемо тренд карактеристика три стабла. Дакле, као што је приказано на доњем коду, у почетку се линија линије за Гиртх црта помоћу функције плот (). Затим се графикони линија за висину и запремину цртају на истој парцели помоћу функције линије ().

Параметар „илим“ у плот () функцији је био да би правилно прилагодио све три линијске карте. Овде је важно имати легенду, јер помаже у разумевању која линија представља коју променљиву. У легенди параметар „лти = 1: 1“ значи да имамо исти тип линије за све променљиве, а „цек“ представља величину тачака.

Шифра:

plot(Girth, type = "o", col = "red", ylab = "", ylim = c(0, 110),
+ main = "Comparison amongst Girth, Height, and Volume of trees")
lines(Height, type = "o", col = "blue")
lines(Volume, type = "o", col = "green")
legend(1, 110, legend = c("Girth", "Height", "Volume"),
+ col = c("red", "blue", "green"), lty = 1:1, cex = 0.9)

Излаз:

5. Дот плот

Овај алат за визуелизацију је користан ако желимо да упоредимо више категорија са одређеном мером. За илустрацију у наставку кориштен је скуп података мтцарс. Дотцхарт () функција приказује помицање за различите моделе аутомобила као што слиједи.

Шифра:

attach(mtcars)
dotchart(disp, labels = row.names(mtcars), cex = 0.75,
+ main = "Displacement for various Car Models", xlab = "Displacement in Cubic Inches")

Излаз:

Дакле, сада ћемо сортирати скуп података на вриједности помицања, а затим их цртати различитим зупчаницима помоћу функције дотцхарт ().

Шифра:

m <- mtcars(order(mtcars$disp), ) m$gear <- factor(m$gear)
m$color(m$gear == 3) <- "darkgreen"
m$color(m$gear == 4) <- "red"
m$color(m$gear == 5) <- "blue"
dotchart(m$disp, labels = row.names(m), groups = m$gear, color = m$color, cex = 0.75, pch = 20,
+ main = "Displacement for Car Models", xlab = "Displacement in cubic inches")

Излаз:

Закључак

Аналитика у правом смислу користи само визуализацијама. Р, као статистички алат, нуди снажне могућности визуелизације. Због тога су бројне опције повезане са графиконима оно што их чини посебним. Свака од листа има сопствену апликацију и графикон треба проучити пре примене проблема.

Препоручени чланци

Ово је водич за Графове у Р. Овде смо расправљали о увођењу и типовима графова у Р, као што су хистограм, расипање, кутија и много више, заједно са примерима и имплементацијом. Такође можете погледати следеће чланке да бисте сазнали више -

  1. Р Типови података
  2. Р Пакети
  3. Увод у Матлаб
  4. Графови вс Графикони