Outliers Formula (Innehållsförteckning)

  • Outliers Formula
  • Exempel på Outliers-formel (med Excel-mall)

Outliers Formula

I statistik är Outliers de två extremt distanserade ovanliga punkterna i de givna datamängderna. Det extremt höga värdet och extremt låga värden är värdena för en datauppsättning. Detta är mycket användbart för att hitta fel eller fel som inträffat. Enkelt som namnet säger är Outliers värden som ljög utanför resten av värdena i datauppsättningen. Tänk exempelvis ingenjörsstudenter och föreställ dig att de hade dvärgar i sin klass. Dvärgarna är de människor som har extremt låg höjd jämfört med andra normalhöjda människor. Så detta är det högre värdet i den här klassen. Ytterligare värden kan beräknas med Tukey-metoden.

Formeln för Outliers -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Exempel på Outliers-formel (med Excel-mall)

Låt oss ta ett exempel för att förstå beräkningen av Outliers-formeln på ett bättre sätt.

Du kan ladda ner denna Outliers-mall här - Outliers Mall

Outliers Formula - Exempel # 1

Tänk på följande datauppsättning och beräkna outliers för datauppsättning.

Datauppsättning = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Stigande orderuppsättning:

Median för stigande ordningsdataset beräknas som:

I denna datauppsättning är det totala antalet data 11. Så n = 11. Median = 11 + 1/2 = 12/2 = 6. Därför är värdet som är i 6: e position i denna datamängd median.

Så medianvärdet = 34.

Dela upp datauppsättningen i två halvor median.

Median för datamängden nedre halvdel och övre halvdel beräknas som:

  • I den nedre halvan 2, 5, 6, 7, 23, om vi hittar median som hur vi hittade i steg 2, skulle medianvärdet vara 6. Så Q1 = 6.
  • I den övre halvan 45, 56, 89, 98, 309 om vi hittar median som hur vi hittade i steg 2, skulle medianvärdet vara 89. Så Q3 = 89.

IQR beräknas med hjälp av formeln nedan

IQR = Q3 - Q1

  • IQR = 89-6
  • IQR = 83

Lower Outlier beräknas med hjälp av formeln nedan

Lägre Outlier = Q1 - (1, 5 * IQR)

  • Lägre Outlier = 6 - (1, 5 * 83)
  • Lägre Outlier = -118, 5

Higher Outlier beräknas med hjälp av formeln nedan

Högre Outlier = Q3 + (1, 5 * IQR)

  • Högre Outlier = 89 + (1, 5 * 83)
  • Högre Outlier = 213, 5

Hämta nu dessa värden i datauppsättningen -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Värden som faller under i det lägre sidovärdet och högre på den högre sidan är det högre värdet. För denna datauppsättning är 309 outlier.

Outliers Formula - Exempel # 2

Tänk på följande datauppsättning och beräkna outliers för datauppsättning.

Datauppsättning = 45, 21, 34, 90, 109.

Stigande orderuppsättning:

Median för stigande ordningsdataset beräknas som:

I denna datauppsättning är det totala antalet data 5. Så n = 5. Median = 5 + 1/2 = 6/2 = 3. Därför är värdet som ligger i 3: e position i denna datauppsättning median.

Så medianvärdet = 45.

Dela upp datauppsättningen i två halvor median.

Median för datamängden nedre halvdel och övre halvdel beräknas som:

  • Q1 = 27, 5
  • Q3 = 89

IQR beräknas med hjälp av formeln nedan

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Lower Outlier beräknas med hjälp av formeln nedan

Lägre Outlier = Q1 - (1, 5 * IQR)

  • Lägre Outlier = 27, 5 - (1, 5 * 72)
  • Lägre Outlier = -80, 5

Higher Outlier beräknas med hjälp av formeln nedan

Högre Outlier = Q3 + (1, 5 * IQR)

  • Högre Outlier = 99, 5 + (1, 5 * 72)
  • Högre Outlier = 207, 5

Förklaring

Steg 1: Ordna alla värden i den givna datauppsättningen i stigande ordning.

Steg 2: Hitta medianvärdet för de data som sorteras. Median kan hittas med följande formel. Följande beräkning ger dig helt enkelt positionen för medianvärdet som finns i datumet.

Median = (n + 1) / 2

Där n är det totala antalet tillgängliga data i datauppsättningen.

Steg 3: Hitta det lägre kvartilvärdet Q1 från datauppsättningen. För att hitta detta använder du medianvärdet datauppsättningen i två halvor. Från den nedre halva uppsättningen av värden, hitta medianen för den nedre uppsättningen som är Q1-värdet.

Steg 4: Hitta det övre kvartilvärdet Q3 från datauppsättningen. Det är exakt som ovanstående steg. Istället för den nedre halvan måste vi följa samma procedur som den övre halvan av värden.

Steg 5: Hitta IQR-värdet för Interquartile Range. För att hitta avdrag Q1-värde från Q3.

IQR = Q3-Q1

Steg 6: Hitta värdet för Inner Extreme. En ände som faller utanför undre sidan som också kan kallas som en mindre outlier. Multiplicera IQR-värdet med 1, 5 och dra av detta värde från Q1 ger dig Inner Lower extreme.

Lägre Outlier = Q1 - (1, 5 * IQR)

Steg 7: Hitta värdet för yttre extrema. Ett slut som faller utanför den högre sidan som också kan kallas en större outlier. Multiplicera IQR-värdet med 1, 5 och summera detta värde med Q3 ger dig Yttre Högre extrema.

Högre Outlier = Q3 + (1, 5 * IQR)

Steg 8: Värden som faller utanför dessa inre och yttre ytterligheter är de utvärderade värdena för den givna datamängden.

Relevans och användningar av Outliers Formula

Outliers är mycket viktiga i alla dataanalysproblem. Utvärderaren visar inkonsekvens i vilken datauppsättning som helst eftersom den definieras som de ovanliga avlägsna värdena i datauppsättningen från en till en annan. Detta är mycket användbart för att hitta eventuella brister som uppstått i datauppsättningen. För när du placerar ett fel i datauppsättningen påverkar det medelvärdet och median kan därmed få stora avvikelser i resultatet om Outliers är i datauppsättningen. Därför är det viktigt att ta reda på Outliers från datauppsättningen för att undvika allvarliga problem i den statistiska analysen.

Rekommenderade artiklar

Detta har varit en guide till Outliers-formeln. Här diskuterar vi hur man beräknar Outliers tillsammans med praktiska exempel och nedladdningsbar Excel-mall. Du kan också titta på följande artiklar för att lära dig mer -

  1. Guide till mellanklassformel
  2. Exempel på löneformel
  3. Kalkylator för DPMO-formel
  4. Hur man beräknar T-distribution?
  5. Kvartilavvikelseformel | exempel