Introduktion till Histogram i R

I den här artikeln ska vi börja med det grundläggande histogrammet i R-implementering och anpassningar. Histogram spelar en viktig roll i dataanalyser för att visualisera data. R-programmering är en speciell miljö för statistisk beräkning och grundläggande för datavetenskap. I R-programmering grupperas datasätt och funktioner i form av paket. De flesta av de visuella analysprogrammen använder histogram och skapar papperskorgen som standard. De gör det möjligt att snabbt förstå insikten om data som är en primär roll i datavetenskapen. Här ska vi bygga ett histogram med R-kommandon.

Vad är Histogram?

Histogrammet är en bild av en datasatsfördelning som vi lätt kan analysera vilken faktor som har en högre mängd data och minst data. Med andra ord tillåter histogrammet att göra kumulativa frekvensdiagram i x-axeln och y-axeln. Histogram tar faktiskt både grupperade och ogrupperade data. För ett grupperat datahistogram konstrueras genom att beakta klassgränser, medan ogrupperade data är det nödvändigt att bilda den grupperade frekvensfördelningen. De hjälper till att analysera omfånget och platsen för data effektivt. Vissa vanliga histogramstrukturer används som vanlig, sned och klippa under datadistribution.

Till skillnad från en stapel har diagramhistogram inte mellanrum mellan staplarna och staplarna här namnges som fack med vilka data representeras i lika stora intervaller. Histogram Tar kontinuerlig variabel och delas upp i intervaller. Det är nödvändigt att välja rätt fackbredd. Den största skillnaden mellan stapeldiagrammet och histogrammet är den förra använder nominella datamängder för att plotta medan histogram plottar de kontinuerliga datamängderna. R använder hist () -funktionen för att skapa histogram. Denna hist () -funktion använder en vektor med värden för att plotta histogrammet. Histogram består av ett x-axelområde med kontinuerliga värden, y-axeln plottar frekvensvärden av data i x-axeln med staplar med höjdvariationer.

Syntax:

Syntaxen för att skapa histogram är

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Skapa ett histogram i R

För analys kräver ändamålshistogram vissa inbyggda datasätt för att importera i R. R och dess bibliotek har olika grafiska paket och funktioner. Här använder vi schweiziska och Air Passengers datauppsättning För att beräkna ett histogram för en given datavärde används hist () -funktion tillsammans med ett $ -tecken för att välja en viss kolumn i en data från datasatsen för att skapa ett histogram.

Följande exempel beräknar ett histogram för datavärdet i kolumnen Undersökning av datasättet med namnet Swiss.

Exempel 1: Låt oss skapa ett enkelt histogram

Koda:

hist (swiss $Examination)

Produktion:

Hist skapas för en dataswiss med en kolumnundersökning. detta plottar helt enkelt ett fack med frekvens och x-axel.

Exempel 2: Histogram med fler argument

För att få en bättre förståelse av histogram måste vi lägga till fler argument till hist-funktionen för att optimera visualiseringen av diagrammet. Ändring av x och y-etiketten till ett antal värden xlim och ylim-argument läggs till funktionen.

Exempel:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Produktion:

Ovanstående kod plottar ett histogram för värdena från datasättet Air Passengers, ger titeln som "Histogram för mer arg", x-axeletiketten som "Namnlista", med en grön kant och en gul färg till staplarna, genom att begränsa värdet som 100 till 600, värdena tryckta på y-axeln med 2 och att göra papperskorgen bredd till 5.

Lägga till två olika färger i baren

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Produktion:

Lägga till fler staplar i histogrammet

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Produktion:

Exempel 3: Histogram i R Det ger ett värde

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Produktion:

Exempel 4: Använd Break Argument för att ändra pappersbredd

För att ha fler brytpunkter mellan bredden föredras att använda värdet i c () -funktionen.

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Produktion:

Ovanstående graf tar bredden på stapeln genom sekvensvärden.

Exempel 5: Implementering av den normala fördelningskurvan i histogram

Vi ska använda datauppsättningen 'schweizisk' för datavärdena för att rita en graf. Här används funktionskurvan () för att visa distributionslinjen.

Koda:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Produktion:

Exempel 6: Plottning av sannolikhetsfördelning

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Skapa täthetsdiagram i histogram i R

Fördelningen av en variabel skapas med funktionstäthet (). Nedan är exemplet med datasetet mtcars. Täthetsplottar hjälper till att fördela formen.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Produktion:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Följande histogram i R visar höjden som en undersökning på x-axeln och densiteten plottas på y-axeln.

Produktion:

Slutsats

Det handlar om histogrammet och just histogram är det enklaste sättet att förstå data. Som vi har sett med ett histogram kan vi rita enstaka, flera diagram, med hjälp av fackbredd, axelkorrigering, ändra färger, etc. Histogrammet hjälper till att visualisera de olika formerna på data. Slutligen har vi sett hur histogrammet gör det möjligt att analysera datauppsättningar och mittpunkter används som etiketter för klassen. Histogrammet hjälper till att ändra intervaller för att producera en förbättrad beskrivning av data och fungerar, särskilt med numeriska data. histogram är mer föredragna i analysen på grund av deras fördel med att visa en stor uppsättning data. Baserat på utgången kunde vi visuellt skjuva uppgifterna och lätt att göra några antaganden.

Rekommenderade artiklar

Detta har varit en guide för Histogram i R. Här har vi diskuterat konceptet, syntax och hur man skapar ett histogram i R med exempel. Du kan också titta på följande artiklar för att lära dig mer -

  1. Histogramsexempel
  2. Karriär inom R-programmering
  3. Gantt-diagram i Tableau
  4. Karriär inom datorprogrammering
  5. Hur skapar jag en linjediagram i R?

Kategori: