Variansformel (innehållsförteckning)

  • Formel
  • exempel

Vad är en variantformel?

Termen "varians" avser omfattningen av spridning av datapunkterna för en datamängd från dess medelvärde, som beräknas som medelvärdet för kvadratavvikelsen för varje datapunkt från befolkningsmedlet. Formeln för en varians kan härledas genom att summera kvadratavvikelsen för varje datapunkt och sedan dela resultatet med det totala antalet datapunkter i datauppsättningen. Matematiskt representeras det som,

σ 2 = ∑ (X i – μ) 2 / N

var,

  • X i = i den datapunkten i datauppsättningen
  • μ = Befolkningsmedelvärde
  • N = Antal datapunkter i befolkningen

Exempel på varianter (med Excel-mall)

Låt oss ta ett exempel för att förstå beräkningen av variationen på ett bättre sätt.

Du kan ladda ner denna Excel-mall för variantformel här - Excel-mall för variantformel

Variansformel - exempel # 1

Låt oss ta exemplet med ett klassrum med fem elever. Klassen hade en medicinsk kontroll där de vägdes och följande data fångades. Beräkna variansen för datamängden baserat på den givna informationen.

Lösning:

Befolkningsmedelvärde beräknas som:

  • Befolkningsmedelvärde = (30 kg + 33 kg + 39 kg + 29 kg + 34 kg) / 5
  • Befolkningsmedelvärde = 33 kg

Nu måste vi beräkna avvikelsen, dvs. skillnaden mellan datapunkterna och medelvärdet.

På samma sätt beräkna för alla värden i datauppsättningen.

Låt oss nu beräkna kvadratavvikelserna för varje datapunkt som visas nedan,

Variansen beräknas med hjälp av formeln nedan

σ 2 = ∑ (Xi - μ) 2 / N

  • σ 2 = (9 + 0 + 36 + 16 + 1) / 5
  • σ 2 = 12, 4

Därför är datauppsättningens varians 12, 4 .

Variansformel - exempel # 2

Låt oss ta exemplet på ett nystartat företag som består av åtta personer. Åldern för alla medlemmar anges. Beräkna variansen för datamängden baserat på den givna informationen.

Lösning:

Befolkningsmedelvärde beräknas som:

  • Befolkningsmedelvärde = (23 år + 32 år + 27 år + 37 år + 35 år + 25 år + 29 år + 40 år) / 8
  • Befolkningsmedelvärde = 31 år

Nu måste vi beräkna avvikelsen, dvs. skillnaden mellan datapunkterna och medelvärdet.

På samma sätt beräkna för alla värden i datauppsättningen.

Låt oss nu beräkna kvadratavvikelserna för varje datapunkt som visas nedan,

Variansen beräknas med hjälp av formeln nedan

σ 2 = ∑ (Xi - μ) 2 / N

  • σ 2 = (64 + 1 + 16 + 36 + 16 + 36 + 4 + 81) / 8
  • 5 = 31, 75

Därför är datauppsättningens varians 31, 75 .

Förklaring

Formeln för en varians kan härledas genom att använda följande steg:

Steg 1: Skapa för det första en population bestående av ett stort antal datapunkter. Dessa datapunkter kommer att betecknas av X i .

Steg 2: Beräkna sedan antalet datapunkter i befolkningen som betecknas av N.

Steg 3: Beräkna därefter populationsmedlen genom att lägga till alla datapunkter och sedan dela resultatet med det totala antalet datapunkter (steg 2) i befolkningen. Befolkningsmedlet betecknas med μ.

μ = X 1 + X 2 + X 3 + X 4 + X 5 / N

eller

μ = ∑ X i / N

Steg 4: Därefter subtraheras populationsmedlet från var och en av populationsens datapunkter för att bestämma avvikelsen för var och en av datapunkterna från medelvärdet, dvs (X 1 - μ) är avvikelsen för den första datapunkten, medan ( X 2 - μ) är för den andra datapunkten etc.

Steg 5: Bestäm sedan kvadratet för alla respektive avvikelser beräknade i steg 4 dvs. (Xi - μ) 2 .

Steg 6: Sätt sedan upp alla respektive kvadratavvikelser beräknade i steg 5 dvs. (X 1 - μ) 2 + (X 2 - μ) 2 + (X 3 - μ) 2 + …… + (X n - μ) 2 eller ∑ (X i - μ) 2 .

Steg 7: Slutligen kan formeln för en varians härledas genom att dela summan av kvadratavvikelserna beräknade i steg 6 med det totala antalet datapunkter i populationen (steg 2) som visas nedan.

σ 2 = ∑ (Xi - μ) 2 / N

Relevans och användningsformer för variationer

Ur statistikens perspektiv är en varians ett mycket viktigt begrepp att förstå eftersom det ofta används i sannolikhetsfördelning för att mäta variationen (volatiliteten) i datauppsättningen gentemot dess medelvärde. Volatiliteten fungerar som ett mått på risk och som sådan har variationen visat sig vara till hjälp vid bedömningen av en investerares portföljrisk. En nollvarians innebär att alla variabler i datauppsättningen är identiska. Å andra sidan kan en högre varians indikera det faktum att alla variabler i datauppsättningen är långt ifrån medelvärdet, medan en lägre varians betyder exakt det motsatta. Kom ihåg att varians aldrig kan vara ett negativt tal.

Rekommenderade artiklar

Detta har varit en guide till Variance Formula. Här diskuterar vi hur man beräknar variationen tillsammans med praktiska exempel och nedladdningsbar Excel-mall. Du kan också titta på följande artiklar för att lära dig mer -

  1. Exempel på Portfolio Variance Formula (Excel Mall)
  2. Guide to Population Variance Formula
  3. Vad är kvartilformel?
  4. Formel för att beräkna provstorlek