Introduktion till Boxplot-etiketter i R

Boxplot-etiketter hjälper till att visualisera distribuerade data i R. Grafen representerar medelvärdet, medianen och variansen. Värdena ges som en inmatning till funktionsboxplot (). Boxplot () -funktionen skapar boxplot med hjälp av givna inmatningsdata. Boxplot kan skapas för enskilda variabler eller en grupp.

Plotta boxplottgrafen

  • Vi behöver fem värderade insatser som medelvärde, varians, median, första och tredje kvartil.
  • Identifiera om det finns några outliers i data.
  • Designa modellen för att plotta data.

Parametrar under boxplot () -funktionen

  1. formel: Den här parametern låter spilla numeriska värden i flera grupper.
  2. Data :: Inmatningsdata som innehåller antingen en dataram eller en lista.
  3. Delmängd: Valfri vektorparameter för att specificera en delmängd för plottning.
  4. xlab: x-axel annotation
  5. ylab: kommentar på y-axeln.
  6. intervall: intervall anger plotförlängningarna.
  7. åtgärd: specificera vad som händer när det finns ett nollvärde. Antingen ignorera svaret eller värdet.

Skapa slumpmässiga data

Vi kan skapa slumpmässiga sampeldata genom funktionen rnorm ().

Låt oss nu använda rnorm () för att skapa slumpmässiga provdata med 10 värden.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Ovanstående kommando genererar 10 slumpmässiga värden med medelvärde 3 och standardavvikelse = 2 och lagrar det i dataramen.

När vi skriver ut data får vi utdata nedan.

STAT1

1 2, 662022

2 2.184315

3 5, 974787

4 4, 536203

5 4, 808296

6 3, 817232

7 1.135339

8 1, 583991

9 3.308994

10 4.649170

Vi kan konvertera samma input (data) till boxplot-funktionen som genererar plotten.

Vi lägger till fler värden i data och ser hur intrigen ändras.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Lägga till fler slumpmässiga värden och använda det för att representera en graf.

Nedan visas värden som lagras i datavariabeln.

STAT 1STAT 2STAT 3STAT 4
3.7954654, 218645.8275852.157315
0.9117264, 091196.2608112, 26594
3.7078283, 359875, 889453.714557
0.1157724, 51235.9348582, 40645
0.6975562, 159456, 811472.571304
5.1292313, 26986.2500683.025175
5.4041014, 389395.6700612, 9901
1.4550663, 130595.6923232, 69693
0.8686365, 423115.4154352.674768
2, 141133, 907286.2060592.806656

Nedan är rutan med 40 värden. Vi har 1-7 nummer på y-axeln och stat1 till stat4 på x-axeln.

Vi kan ändra textinriktningen på x-axeln genom att använda en annan parameter som heter las = 2.

Analysera grafen över R Boxplot-etiketter

Vi har angett inmatningen i dataramen och vi ser ovanstående plot.

För att förstå uppgifterna låt oss titta på stat1-värdena.

Plottet representerar alla 5 värden. Börjar med minimivärdet från botten och sedan den tredje kvartilen, medelvärdet, första kvartilen och minimivärdet.

Ovanstående plot har textjustering horisontellt på x-axeln.

Ändra färg

I alla ovanstående exempel har vi sett handlingen i svart och vitt. Låt oss se hur vi ändrar färgen på tomten.

Vi kan lägga till parametern col = color i boxplot-funktionen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Nedan kan vi se plotutgången i rött.

Med hjälp av samma kod ovan kan vi lägga till flera färger i tomten.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Lägga till etiketter

Vi kan lägga till etiketter med hjälp av parametrarna xlab, ylab i boxplot-funktionen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Genom att använda huvudparametern kan vi lägga till rubrik till plotten.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Notch-parameter används för att göra plot mer begripligt. Eftersom medianerna av stat1 till stat4 inte matchar i ovanstående komplott.

Fördelar och nackdelar med Boxplot

fördelar

  • Att sammanfatta stora mängder data är enkelt med boxplot-etiketter.
  • Visar intervall och datadistribution på axeln.
  • Det indikerar symmetri och skevhet
  • Hjälper till att identifiera outliers i data.

nackdelar

  • Kan endast användas för numeriska data.
  • Om det finns skillnader i uppgifterna kan rutan inte vara korrekt.

Anmärkningar:

  1. Grafer måste märkas korrekt.
  2. Vågen är viktiga; ändra skalor kan ge data en annan vy.
  3. Jämförelse av data med rätt skala bör vara konsekvent

Slutsats - R Boxplot-etiketter

Datagruppering görs enkelt med hjälp av boxplots. Box-plot stöder flera variabler såväl som olika optimeringar. Vi kan också variera skalorna beroende på data.

Boxplots kan användas för att jämföra olika datavariabler eller uppsättningar.

Boxplots användbarhet är enkel och bekväm. Vi behöver konsekventa data och korrekta etiketter. Boxplots används ofta inom datavetenskap och även av säljteam för att gruppera och jämföra data. Boxplot ger insikter om potentialen i data och optimeringar som kan göras för att öka försäljningen.

Boxplot är ett intressant sätt att testa data som ger insikter om datorns inverkan och potential.

Rekommenderade artiklar

Detta är en guide till R Boxplot-etiketter. Här diskuterar vi funktionen Parametrar under boxplot (), hur man skapar slumpmässiga data, ändrar färg- och grafanalys tillsammans med fördelar och nackdelar. Du kan också titta på följande artikel för att lära dig mer -

  1. Typer av datavisualisering
  2. Implementering av datalager
  3. Datavetenskapstekniker
  4. Vad är datakub?

Kategori: