Srovnání statistik velikosti efektu

Pokud pracujete v oboru, který používá analýzu rozptylu, jistě jste slyšeli, že samotné p-hodnoty nevypovídají o velikosti efektu. Je třeba uvést také nějakou míru velikosti účinku.

Proč? Protože při dostatečně velkém vzorku může být jakýkoli rozdíl v průměrech, bez ohledu na to, jak malý je, statisticky významný. Hodnoty P jsou určeny k tomu, aby vám řekly, zda je váš výsledek náhodný, ne zda je velký.

Vskutku nejjednodušší a nejpřímočařejší mírou velikosti efektu je rozdíl mezi dvěma průměry. A tu už pravděpodobně uvádíte. Omezením této míry jako velikosti účinku však není nepřesnost. Je jen obtížné ji vyhodnotit.

Pokud znáte oblast výzkumu a proměnné používané v této oblasti, měli byste vědět, zda je rozdíl 3 bodů velký nebo malý, i když vaši čtenáři možná ne. A pokud hodnotíte nový typ proměnné, může to být těžké zjistit.

Standardizované velikosti efektů jsou určeny pro snadnější hodnocení. Odstraňují jednotky měření, takže nemusíte znát škálování proměnných.

Cohenovo d je dobrým příkladem standardizovaného měření velikosti efektu. V mnoha ohledech je ekvivalentem standardizovaného regresního koeficientu (v některých programech označeného jako beta). Obě jsou standardizované míry – dělí velikost účinku příslušnými směrodatnými odchylkami. Cohenovo d i standardizované regresní koeficienty jsou tedy namísto původních jednotek X a Y vyjádřeny ve směrodatných odchylkách.

Standardizované míry velikosti účinku mají některé pěkné vlastnosti. Především je možné je porovnávat napříč proměnnými. A v mnoha situacích je velmi užitečné vidět rozdíly v počtu směrodatných odchylek.

Jsou však nejužitečnější, pokud si zároveň dokážete uvědomit jejich omezení. Na rozdíl od korelačních koeficientů mohou být Cohenovo d i beta větší než jedna. Takže je sice můžete vzájemně porovnávat, ale nemůžete se podívat jen na jeden z nich a hned říct, co je velké a co malé. Pouze se díváte na účinek nezávislé proměnné ve smyslu směrodatných odchylek.

Toto je obzvláště důležité si uvědomit u Cohenova d, protože ve své původní knize určil určité hodnoty d jako ukazatele malých, středních a velkých účinků v behaviorálním výzkumu. Ačkoli samotná statistika je dobrá, měli byste tato doporučení ohledně velikosti brát s rezervou (nebo možná s hodně velkou miskou soli). To, co je velký nebo malý účinek, velmi závisí na konkrétní oblasti výzkumu a i malý účinek může být teoreticky významný.

Jiná sada měr velikosti účinku pro kategorické nezávislé proměnné má intuitivnější výklad a snáze se vyhodnocuje. Patří mezi ně Eta Squared, Partial Eta Squared a Omega Squared. Stejně jako statistika R Squared mají všechny intuitivní interpretaci podílu zohledněného rozptylu.

Eta Squared se počítá stejným způsobem jako R Squared a má nejvíce ekvivalentní interpretaci: z celkové variability Y je podíl, který lze připsat konkrétnímu X.

Eta Squared se však používá speciálně v modelech ANOVA. Každý kategoriální účinek v modelu má svůj vlastní Eta Squared, takže získáte konkrétní, intuitivní míru účinku dané proměnné.

Eta Squared má však dvě nevýhody. Jednou z nich je, že s přidáváním dalších proměnných do modelu se automaticky snižuje podíl vysvětlený jakoukoli jednou proměnnou. To ztěžuje porovnávání účinku jedné proměnné v různých studiích.

Parciální Eta Squared tento problém řeší, ale má méně intuitivní interpretaci. V tomto případě není jmenovatelem celková variabilita Y, ale nevysvětlená variabilita Y plus variabilita vysvětlená právě danou X. Jakákoli variabilita vysvětlená jinými X je tedy ze jmenovatele odstraněna. To umožňuje výzkumníkovi porovnat vliv stejné proměnné ve dvou různých studiích, které obsahují různé kovariáty nebo jiné faktory.

V jednosměrné ANOVĚ se Eta Squared a Partial Eta Squared budou rovnat, ale to neplatí v modelech s více než jednou nezávislou proměnnou.

Nevýhodou Eta Squared je, že jde o zkreslenou míru vysvětlené populační variance (i když je přesná pro vzorek). Vždy ji nadhodnocuje.

Toto zkreslení se velmi zmenšuje s rostoucí velikostí vzorku, ale pro malé vzorky je nezkreslenou mírou velikosti účinku Omega Squared. Omega Squared má stejnou základní interpretaci, ale používá nezkreslené míry složek rozptylu. Because it is an unbiased estimate of population variances, Omega Squared is always smaller than Eta Squared.

Other recent posts contain equations of all these effect size measures and a list of great references for further reading on effect sizes.

Effect Size Statistics

Statistical software doesn’t always give us the effect sizes we need. Learn some of the common effect size statistics and the ways to calculate them yourself.

Napsat komentář Zrušit odpověď na komentář