分散分析を使う分野であれば、p値だけでは効果の大きさを示すことはできないと聞いたことがあるはずです。 また、何らかの効果量の指標を示す必要があります。
なぜでしょうか。 なぜかというと、十分なサンプルサイズがあれば、平均値の差は、どんなに小さくても、統計的に有意になり得るからです。
最もシンプルでわかりやすい効果量の指標は、2つの平均の差です。 そして、おそらくすでにそれを報告していることでしょう。 しかし、効果量としてのこの尺度の限界は、不正確なことではありません。
ある研究分野とその分野で使用される変数に精通していれば、3ポイントの差が大きいか小さいかはわかるはずですが、読者はそうではないかもしれません。
標準化効果量は、より簡単に評価できるように設計されています。
標準化された効果量は、評価を容易にするために設計されたもので、測定単位が削除されているので、変数のスケーリングに精通している必要はありません。 これは、多くの点で標準化回帰係数 (一部のソフトウェアではベータと表記) と同等です。 どちらも標準化された測定値であり、効果の大きさを関連する標準偏差で割ります。 つまり、X と Y の元の単位ではなく、コーエンの d と標準化回帰係数の両方が標準偏差で表されます。
標準化効果量測定には、いくつかの素晴らしい特性があります。
標準化効果量には、いくつかの良い特性があります。 そして、多くの状況で、標準偏差の数で違いを見ることは非常に有用です。
しかし、その限界も認識できれば、最も有用です。 相関係数とは異なり、コーヘンの d とベータは両方とも 1 よりも大きくなることがあります。 そのため、これらを互いに比較することはできますが、一方だけを見て、何が大きいか小さいかをすぐに判断することはできません。
これは、コーエンのdについて特に重要なことです。なぜなら、彼は元の本で、行動研究における小さな効果、中程度の効果、大きな効果を示すものとして、特定のd値を指定しているからです。 この統計量自体は良いものですが、これらのサイズの推奨は、塩の粒(あるいは非常に大きな塩のボウル)で受け止める必要があります。
カテゴリ独立変数の効果量測定の別のセットは、より直感的な解釈を持ち、評価しやすくなっています。
カテゴリ独立変数の効果量測定は、より直感的な解釈が可能で、評価も簡単です。
Eta SquaredはR Squaredと同じ方法で計算され、最も等価な解釈をします。Yの全変動のうち、特定のXに帰することができる割合です。
しかし、Eta SquaredはANOVAモデルで特に使用されます。
しかし、Eta Squared は ANOVA モデルで特に使用されます。モデル内の各カテゴリ効果はそれ自身の Eta Squared を持っているので、その変数の効果の特定の、直感的な測定値を得ることができます。
しかし、Eta Squared には2つの欠点があります。1つは、モデルに多くの変数を追加すると、任意の1つの変数によって説明される割合が自動的に減少することです。
部分エータ2乗はこの問題を解決しますが、あまり直感的な解釈ではありません。
部分η2乗はこの問題を解決するものですが、より直感的な解釈ができません。そこでは、分母がYの全変動ではなく、Yの説明できない変動とそのXによってのみ説明される変動となります。
一元配置のANOVAでは、Eta二乗とPartial Eta二乗は等しくなりますが、複数の独立変数があるモデルではそうではありません。
Eta二乗の欠点は、(サンプルでは正確ですが)説明される母集団の分散の偏った尺度であることです。
このバイアスはサンプルサイズが大きくなると非常に小さくなりますが、小さなサンプルでは、バイアスのない効果量測定はオメガ2乗です。 オメガ・スクエアは、基本的な解釈は同じですが、分散成分のバイアスのかかっていない測定値を使用します。 Because it is an unbiased estimate of population variances, Omega Squared is always smaller than Eta Squared.
Other recent posts contain equations of all these effect size measures and a list of great references for further reading on effect sizes.