Vad är datavisualisering?

Och varför vi inte bryr oss om cirkeldiagram längre,

Datavisualisering är inte bara en översättning av datapunkter till smarta stapeldiagram och linjediagram. Det är som ett dyk i ett hav som gömmer skatter på varje nivå. I början har vi en enkel avgränsning av data i läroboksfigurer, nämligen. spridningsdiagram, linjediagram, cirkeldiagram och stapeldiagram. Linjediagram används vanligtvis för att visa en trend med data över tiden. I det här ämnet av vad som är datavisualisering har vi rensat hela konceptet framåt med de angivna diagram och cirkeldiagram.

Cirkeldiagram

Ett av de mest allestädes närvarande listorna som används är pizzatabellen eller pajdiagrammet.

Andel gaser i en blandning.

Källa : plotly

Vanligtvis används vid val för att visa vilket parti som har fått lejonerna att dela rösterna, har detta diagram, även om det är oerhört populärt, några lysande nackdelar. Statistiker som Edward Tufte, Leland Wilkinson och Gerald van Belle har uttryckt sin missnöje gentemot användningen av cirkeldiagram. Det mest avgörande beviset mot cirkeldiagram har antagligen tillhandahållits av Stephen Few, grundaren av Perceptual Edge. I sin artikel, "Save the Pie for the Dessert" som publicerades i Visual Business Intelligence Newsletter, förklarar Stephen varför han, till sina kollegas och studenters förvånande, tycker att cirkeldiagram är ett ineffektivt sätt att visualisera data.

Ta en titt på cirkeldiagrammet nedan.

I denna graf som visar andelen livsmedel som beställts efter 21.00 är det lätt att uppskatta andelen som tillhör Glass - 25%. Efter en liten modifiering är det emellertid inte längre möjligt att fastställa procentandelen beställningar som går på glass.

Även om andelen glass är fortfarande densamma på 25%. Det är svårt att förstå från diagrammet ovan. I det föregående diagrammet var det lätt att gissa procenten, eftersom skuggan för glass började vid 6 o klockposition och sträckte sig till 9 o klockposition. När våra ögon tränas för att se klockorna vid 12, 3, 6 och 9 - är ett cirkeldiagram också lättare att tolka om dess regioner följer de fyra klockpositionerna. En ivrig cirkeldiagramsupporterare skulle komma fram och föreslå att detta problem lätt skulle kunna undvikas genom att använda etiketter och markera procentandelen mot varje region.

Cirkeldiagram med datatiketter

Men än en gång, för att kartlägga värdet med objektet, måste våra ögon fortsätta att flytta fokus från legenden längst ner i diagrammet till etiketterna i diagrammet. Lösningen på det skulle vara att bifoga artikelnamnet också, tillsammans med värdena - att få något liknande till detta:

Perfekt, skulle du säga. Men då frågar jag er - Nu när vi har bifogat namnen på objekten tillsammans med värdena, hur skiljer sig cirkeldiagrammet ovan från tabellen nedan:

Ren tabell med data sorterade efter Procentandel av ordning

Ser denna information inte mycket bättre ut än etiketter och legender spridda över cirkeldiagrammet. Vad är det som använder ett cirkeldiagram då? Visualiseringar ska tillföra ett mervärde, de är agenter för slutsatser, de ska göra att uppgifterna avslöjar dess hemligheter. Men i detta fall uppfyller cirkeldiagrammet inte sitt löfte.

Ange stapeldiagrammet för datavisualisering

Det smalare och mycket mer eleganta alternativet till cirkeldiagrammet är stapeldiagrammet, som kan uttrycka allt som pajen säger och mycket mer, utan att göra en röra med etiketter och legender.

Stapeldiagram som visar samma - lätt att jämföra, kontrastera och dra slutsatsen

Detta är samma information som nu presenteras försiktigt för observatören. Förutom att visa de enskilda värdena möjliggör denna graf oss snabbt att jämföra populariteten för varje matvaror och till och med jämföra den relativa skillnaden i värde mellan på varandra följande artiklar. Samma data hade varit tillgängliga via tabellen, men våra hjärnor är bättre på att bearbeta bilder än att dechiffrera texten. Det är därför användningen av cirkeldiagrammet har minskat med tiden. Även om det är en favoritbild i medieindustrin har detta ersatts av bättre och mer sofistikerade framställningar. Förutom linjediagram, pajer och stapeldiagram finns det en mängd andra diagram som är praktiska. En intressant graf, men inte så populär för de oinitierade är Sankey Diagram. Detta diagram används för att uttrycka fördelningen och flödet av materien. Frågan i fråga kan vara energi, pengar eller till och med vatten.

Sankey Diagram över energiflöde och distribution av en typisk IT-anställd.

Ovan är ett fiktivt Sankey-diagram som uttrycker hur och var mest av energin hos en IT-anställd distribueras.

Nyare verktyg

Med tillkomsten av sociala medier och de olika plattformarna där människor kan skriva ut sina känslor, recensioner och åsikter, är ett datavisualiseringsverktyg som har blivit ganska vanligt ordmoln. Ordmoln hjälper oss ta reda på vad folk pratar om.

En mycket verklig live-molnrepresentation av användarrecensionerna av PUBG i google play store

Om vi ​​tittar på ordet moln här som har byggts från de 80 bästa recensionerna av spelet PUBG i google play store ser vi att det övergripande svaret på spelet är "bra", vissa människor till och med kallar det "bästa" . Det verkar dock som om det finns ett problem med vissa "uppdateringar" som folket ber med spelskaparna om att korrigera. Faktum är att när vi kontrollerar recensionerna av lekbutiken den dagen ser vi samma sak återspeglas.

Problemet med uppdateringar. Se även om du kan hitta en förekomst av ordet "snälla" här

Framtiden

Det här är bara att skrapa toppen av isberget. Bibliotek som plotly och D3 har tagit datavisualisering till en annan nivå. Detta har hänt på grund av att efterfrågan också har förändrats. Hur skulle du visualisera en smart stad på en instrumentbräda? En jätteskärm där vitalerna i en hel stad kan visas. Trafiken, strömförbrukningen, hälsoförhållandena i olika områden, luftkvalitet och en mängd andra parametrar måste visas på en enda sida. Detta krav kräver en annan strategi för datavisualisering Så vi har lärt oss att vad som är datavisualisering med hjälp av detta koncept. Vi kan inte längre hålla fast vid diagram och diagram. En ny metod krävs där grafer möter konst och fantasi, vilket skapar en berikande visuell upplevelse. Tills nästa gång.

Rekommenderade artiklar

Den här artikeln är en användbar guide om vad som är en datavisualisering. Här har vi diskuterat de grundläggande koncepten med diagram och grafer så att du enkelt kan förstå datavisualisering. Du kan också titta på följande artikel för att lära dig mer -

  1. Karriär i Oracle-databasadministratör
  2. 7 Den mest användbara skillnaden mellan Data mining vs Web mining
  3. Data Analytics intervjufrågor
  4. Exempel på Big Data Analytics

Kategori: