Översikt av Two Way ANOVA i R
Tvåvägs ANOVA (analys av variation) hjälper oss att förstå förhållandet mellan en kontinuerlig beroende variabel och två kategoriska oberoende variabler. I det här ämnet kommer vi att lära oss om Two Way ANOVA i R.
Nedan visas hypotesen om intresse under tvåvägs ANOVA
- H₀: Kall det huvudeffekten som är den första faktorn som är beroende av den kontinuerliga variabeln
- H₀: Huvudeffekten handlar också om effekten på den andra variabeln på den beroende kontinuerliga variabeln.
- H₀: Interaktion är den kombinerade effekten av både första, andra faktorvariabel på den beroende variabeln
Nedan följer de normer som en tvåvägs ANOVA måste uppfylla.
- Observationer måste vara oberoende
- Observationer bör normalt distribueras.
- Det bör finnas lika varians i observationerna
- Inga outliers i design
- Fel bör vara oberoende.
Notera
Vi måste omvandla våra data om normalitet och lika varians bryts.
Exempel på tvåvägs ANOVA i R
Låt oss utföra ett sätt ANOVA-test på datainsamlingen med cancernivåer som innehåller 48 rader och 3 datavariabler:
Tid taget: Överlevnadstid för ett djur
Olika nivåer av cancer 1 - 3
Behandling: Behandlingar som används 1-3
Innan vi testar, behöver vi följande data till hands.
- Importera data
- Ta bort onödig variabel
- Konvertera variabler (nivåer av cancer) som ordnad nivå.
Nedan visas datauppsättningen.
Observationer: 48
Variabler: 3
tid för överlevnad 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …
cancernivåer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Behandling A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
mål
- H₀: ingen förändring i genomsnittlig överlevnadstid mellan gruppen
- H₀: överlevnadstiden är annorlunda för minst en grupp.
Steg
- Kontrollera cancernivåerna. Vi kan se tre teckenvärden eftersom vi konverterar dem till faktorer med ett mutatverb.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Beräkna både medel- och standardavvikelse
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Produktion:
En tibble: 3 x 4
cancerlevlar count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- I steg tre kan du grafiskt kontrollera om det finns skillnad mellan fördelningarna. Observera att du inkluderar den jitterade pricken.
- Kör test med kommandot AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Syntax:
y ~ X1 + X2 +… + Xn (X1 + X2 +… hänvisar till de oberoende variablerna)
y ~. Använd alla återstående variabler som oberoende variabler
Se till att du sparar modellen och skriver ut sammanfattningen.
Koda
- aov (tid ~ cancernivåer, data = df): Kör ANOVA-testet med följande formel
- sammanfattning (anova_one_way): Skriv ut sammanfattningen av testet
Df Sum Sq Medel Sq F-värde Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Residualer 45 1, 972 0, 0438
-
Signif. koder: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0, 1 '' 1
P-värdet är lägre än tröskeln 0, 05. Den statistiska skillnaden indikeras med '*' i ovanstående fall.
One Way Test to Two Way Anova i R
Låt oss se hur envägstestet kan utökas till tvåvägs ANOVA. Testet liknar envägs ANOVA men formeln skiljer sig och lägger till en annan gruppvariabel till formeln.
y = x1 + x2
- H0 : Medlet är lika för båda variablerna (faktorvariabler)
- H3 : Medlet är olika för båda variablerna
Du lägger till behandlingsvariabler till vår modell. Denna variabel indikerar behandlingen som ges till patienten. Du är intresserad av att se om det finns ett statistiskt beroende mellan cancernivåerna och behandlingen som ges till patienten.
Vi justerar vår kod genom att lägga till en behandling med den andra oberoende variabeln.
Df Sum Sq Medel Sq F-värde Pr (> F)
Cancernivåer 2 1.0330 0.5165 20.64 5.7e-07 ***
Behandla 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Residuals 42 1.0509 0, 0250
Både cancernivåer och behandling skiljer sig statistiskt från 0. Genom detta kan vi avvisa NULL-hypotesen. Bekräfta också att ändra behandling eller typ av cancer påverkar överlevnadstiden.
Testa
Envägs ANOVA: H3- Genomsnittet är olika för minst en grupp
Tvåvägs ANOVA: H3- Genomsnittet är olika för båda grupperna.
Skillnaden mellan ett sätt och tvåvägs ANOVA
Skillnader mellan enkelriktad ANOVA och tvåvägs ANOVA
Envägs ANOVA | Tvåvägs ANOVA |
Utformad för att möjliggöra jämställdhetstestning mellan tre eller fler medel | Utformad för att bedöma förhållandet mellan två oberoende variabler på en beroende variabel. |
Involverar en oberoende variabel | Involverar två oberoende variabler |
Analyserad i 3 eller flera kategoriska grupper. | Jämför flera grupper med två faktorer |
Måste uppfylla två principer - replikering och randomisering | Måste uppfylla tre principer som är replikering, randomisering och lokal kontroll. |
Fördelar med tvåvägs ANOVA
- I exemplet ovan hjälper ålder och kön i vårt exempel till att minska felvariationen och göra designen mer effektiv.
- Tvåvägs ANOVA gör det möjligt för oss att testa effekten av två faktorer samtidigt.
Ansökningar från ANOVA
- Jämför körsträcka för olika fordon, bränsle och vägtyper.
- Lär känna effekterna av temperatur, tryck eller kemisk koncentration på någon kemisk reaktion (kraftreaktorer, kemiska anläggningar, etc.)
- Påverkan av olika katalysatorer på kemiska reaktionshastigheter
- Förstå effekterna av reklamfilmer och olika antal kundsvar.
- Effekt av prestanda, kvalitet och hastighetstillverkning inom biologi (process baserat på antalet celler de blir uppdelat i)
Rekommenderade artiklar
Detta är en guide till Tvåvägs ANOVA i R. Här diskuterar vi exempel, mål, steg och skillnad mellan Envägs och Tvåvägs ANOVA. Du kan också titta på följande artiklar för att lära dig mer -
- ANOVA i R
- Hur man tolkar resultat med ANOVA-test
- Regression vs ANOVA
- GLM i R