Увод у хистограм у Р

У овом чланку ћемо почети са основним хистограмом у Р имплементацији и прилагодбама. Хистограм игра важну улогу у анализама података за визуелизацију података. Р програмирање је посебно окружење за статистичко рачунање и основе за науку о подацима. У Р програмирању се скупови података и функције групирају у облику пакета. Већина програма визуелне аналитике користи хистограме и поставља ширину канте као задану. Омогућавају брзо увид у податке који су основна улога у науци о подацима. Овде ћемо изградити хистограм користећи Р команде.

Шта је хистограм?

Хистограм је сликовни приказ дистрибуције података помоћу којег бисмо лако могли анализирати који фактор има већу количину података и најмање података. Другим речима, хистограм омогућава прављење кумулативних графикона фреквенције у оси к и и. Заправо, хистограми узимају и груписане и груписане податке. За груписане податке хистограм се израђује узимајући у обзир границе класе, док је за груписане податке потребно формирати груписану дистрибуцију фреквенција. Помажу ефикасној анализи распона и локације података. Примјењује се нека уобичајена структура хистограма попут нормалне, нагнуте и литице током дистрибуције података.

За разлику од шипке, хистограм графикона нема празнине између шипки, а овде су траке означене као канте са којима су подаци представљени у једнаким интервалима. Хистограм Узима непрекидну променљиву и дели се на интервале, потребно је одабрати исправну ширину канте. Главна разлика између шипке и хистограма је то што се први користе номинални сетови података за цртање, док хистограм црта континуиране скупове података. Р користи хист () функцију за прављење хистограма. Ова хист () функција користи вектор вредности за цртање хистограма. Хистограм се састоји од опсега континуираних вредности оси к, а и-оса црта честе вредности података у к-оси са шипкама варијација висина.

Синтакса:

Синтакса за креирање хистограма је

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Израда хистограма у Р

За анализу, наменски хистограм захтева неки уграђени скуп података за увоз у Р. Р, а његове библиотеке имају различите графичке пакете и функције. Овде користимо швајцарске и Аир Дата путнике. За израчунавање хистограма за дату вредност података вредност хист () користи се заједно са знаком $ да би се изабрао одређени ступац података из скупа података како би се створио хистограм.

Следећи пример израчунава хистограм вредности података у колони Испитивање скупа података под називом Свисс.

Пример 1: Направимо једноставан хистограм

Шифра:

hist (swiss $Examination)

Излаз:

Хист је креиран за штрајк скупа података са прегледом колоне. ово једноставно црта канту са фреквенцијом и оси к.

Пример 2: Хистограм са више аргумената

Да бисмо постигли боље разумевање хистограма, морамо додати више аргумената функцији хист да бисмо оптимизирали визуелизацију графикона. Промјена к и и ознаке у распон вриједности клим и илим аргументима се додају функцији.

Пример:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Излаз:

Изнад кода приказује хистограм за вредности из скупа података Аир Пассенгерс, даје наслов као „Хистограм за више арг“, к-оса као „Наме Наме“, са зеленом обрубом и жутом бојом, ограничавајући вредност је 100 до 600, вредности исписане на оси и за 2 и чинећи ширину канте за 5.

Додавање две различите боје у траку

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Излаз:

Додавање додатних трака на хистограм

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Излаз:

Пример 3: Хистограм у Р враћа вредност

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Излаз:

Пример 4: Коришћење Бреак Аргумента за промену ширине канте

Да би било више тачака прекида између ширине, пожељно је користити вредност у ц () функцији.

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Излаз:

Горњи граф узима ширину траке кроз вредности секвенце.

Пример 5: Примена кривуље нормалне дистрибуције на хистограму

За податке података користимо скуп података „свисс“ за цртање графа. Овде се функцијска кривуља () користи за приказ линије дистрибуције.

Шифра:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Излаз:

Пример 6: Расподјела вероватноће за планирање

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Стварање парцела густоће на хистограму у Р

Расподјела варијабле се ствара коришћењем густине функције (). Испод је пример са мтцарсом скупа података. Парцеле густоће помажу у дистрибуцији облика.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Излаз:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Следећи хистограм у Р приказује висину као испитивање оси к, а густина се црта на оси и.

Излаз:

Закључак

То је све о хистограму, а управо је хистограм најлакши начин за разумевање података. Као што смо видели помоћу хистограма, могли смо цртати појединачне, вишеструке графиконе, користећи ширину канте, корекцију оси, промену боја, итд. Хистограм помаже у визуелизацији различитих облика података. Коначно, видели смо како хистограм омогућава анализу скупова података, а средње тачке се користе као ознаке класе. Хистограм помаже у промјењивим интервалима да би се добио побољшани опис података и дјелује, посебно са нумеричким подацима. хистограми су пожељнији у анализи због њихове предности приказивања великог низа података. На основу резултата могли бисмо визуелно скенирати податке и лако смо изнијети неке претпоставке.

Препоручени чланци

Ово је водич за Хистограм у Р. Овде смо разговарали о концепту, синтакси и како створити хистограм у Р помоћу примера. Такође можете погледати следеће чланке да бисте сазнали више -

  1. Примери хистограма
  2. Каријера у Р програмирању
  3. Гантт Цхарт у Таблеау-у
  4. Каријера у рачунарском програмирању
  5. Како креирати линијски графикон у Р?

Категорија: