効果量 effect size

 効果量は,データの単位に依存しない標準化された効果の程度を表す指標です.効果とは,データの差・影響・相関・連関のことです.効果量は単位の異なる研究から得られた効果の比較や人数の異なる研究から得られた効果の比較が可能です.例えば,論文Aの報告で若年群と高齢群の膝伸展筋力の差が平均30±10kgだったとします.次に論文Bの報告では若年群と高齢群の膝伸展筋力の差が平均20±30N(ニュートン)だったとします.この結果を見て,論文BよりもAの差が大きいとは言えません.それはデータの単位がkgとNで異なるからです.どちらの論文の結果の差が大きいかを比べたいときは,効果量を求めて比較すると明確になります.なお,効果量はノンパラメトリックな手法(ノンパラメトリック検定)が対象となるデータでも算出できるものがあります.
 また効果量には,いくつか種類があり,特にrという効果量と,dという効果量の2種類が代表的です.rもdも計算方法が異なるだけで意味は同一なのですが,rは0~1(もしくは0~-1)の範囲をとるので理解しやすいメリットがあります.従って,通常はrを利用します.
 効果量を計算できる統計ソフトは少ないですが,ウェブサイト(http://www.mizumot.com/stats/effectsize.xls)で無料配布されているファイルを使用するのが便利です.
 以下に,効果量の判定基準を記載します.
 
検定 指標 効果量の基準 補足
小 中 大
t検定(差の検定としての) r 0.1 0.3 0.5 対応のあるt検定,2標本の差の検定で同一値.rとdの2種類ある.通常はrを利用
d 0.2 0.5 0.8
分散分析 η2 0.01 0.06 0.14 多重比較法はt検定(差の検定としての)を参照
相関 r 0.1 0.3 0.5 相関係数そのままである
カイ2乗検定(χ2検定)
(2×2分割表)
φ 0.1 0.3 0.5 連関係数である
カイ2乗検定(χ2検定)
(上記以外の分割表)
クラメールのV 0.1 0.3 0.5 連関係数である
ノンパラメトリックな手法(ノンパラメトリック検定) r 0.1 0.3 0.5 Mann–WhitneyのU検定,Wilcoxonの符号順位検定,Kruskal-Wallisの検定,Friedmanの検定で求められる検定統計量Zを用いてr=Z/√n
(重)回帰分析 R2 0.02 0.13 0.26 決定係数である
EBPT用語集の参考文献はこちらのページ下段に掲載しています。ご参照ください。