多重比較(読み)たじゅうひかく(英語表記)multiple comparison

最新 心理学事典 「多重比較」の解説

たじゅうひかく
多重比較
multiple comparison

複数検定を繰り返し行なう場合に,その複数の検定を「検定のセット」と考え,セット全体で第一種の誤り(検定仮説が正しいにもかかわらず,その仮説を棄却するという誤り)を事前に設定した有意水準以下に抑えるための方法を指す。

【検定の繰り返しと多重比較の必要性】 心理学研究においては実験群対照群の単純な比較だけではなく,複数の条件間での違いを調べたいという場合が多い。たとえば顔情動刺激の評定へのプライミング効果を調べたい場合,怒り,悲しみ,喜びの三つの顔表情を見せる条件とコントロール群の四つの条件を比較するため,対人関係に関する評定を被験者に行なってもらうとする。ここで「怒り条件と悲しみ条件の比較」「喜び条件とコントロール条件の比較」などといった形で2群の平均値差の検定-testを行なうと,42=6通りの検定を行なうことになる。このような単純な検定の繰り返しは,6通りの検定全体での第一種の誤り(この場合は,差がないのに差があると判断する誤り)を過剰に大きくさせるので行なうべきではない。なぜなら,有意水準を5%として6回の検定を行なえば,6回の検定の中で,1回以上第一種の誤りを犯す確率は0.05より大幅に大きくなるためである。6回の検定が独立仮定すると,その確率は

 1-0.956≒0.265

となる。ただし実際には検定間に相関があるため,上記よりは小さくなる。6回の検定を一つの分析単位と考え,全体で第一種の誤りの確率をコントロールしたいとすると,本来設定した第一種の誤りの5%をはるかに上回る約26.5%の確率で,本来は6通りの条件間の比較についてどれも本来は差がないのに,どれか一つは誤って有意に差があると判断してしまうことになる。

 そこで,複数の検定を繰り返し行なう際には,「検定のセット」全体で第一種の誤りを事前に設定した有意水準以下に抑えるための多重比較が行なわれる。

 なお,多重比較は一般的には分散分析の後に実施されることが多いが,分散分析以外の場合でも,利用する必要がある場合がある。たとえば,四つの国で「攻撃性(尺度)と学校での適応(得点)の相関関係」に違いがあるかを調べる場合にも,6通りの相関係数の差の検定を行なうことになり,6回の検定全体での第一種の誤りをコントロールする多重比較法を実施する必要がある。

【多重比較の分類】 多重比較にはさまざまな方法があるが,⑴利用目的の観点からの分類,⑵必要な前提条件からの分類,⑶ステップ数からの分類に分けることができる。

 ⑴の観点からは,「すべての水準間比較を目的とするもの」「対照群との比較を目的とするもの」「対比(第一群の平均は第二群と第三群の平均の平均に等しい,などといった平均値の線形結合)についての検定を目的とするもの」に分類できる。⑵には,「正規性の仮定が必要かどうか」,反復測定での各水準間の比較などの「各検定が独立でない場合でも利用できるかどうか」という二つの観点がある。⑶については,一度にすべての検定を行なうシングルステップ法と段階的に検定を行なうステップワイズ法がある。

 「正規性の仮定」「独立の仮定」の条件が成立しない場合にこれらの仮定に基づいた多重比較を用いると,誤った結論に至る可能性がある。一方,これらの仮定が成立しているデータに対して仮定が不要な方法(次の小見出しで述べる「有意水準を調整する方法」)を利用すると,検出力が低くなり有意になりにくい。データや研究計画によってどのような方法がふさわしいかについて注意する必要がある。

【有意水準を調整する方法】 個別の検定の有意水準を調整することによって,「検定のセット全体」の第一種の誤りを調整する方法として,ここではボンフェロニの方法とホルムの方法を紹介する。これらの方法は複数の群の平均値の比較に限らず,「複数の相関係数や重回帰分析ですべての係数の有意性の検定を,全体での有意水準を一定に保ちながら行なう」など,分散分析モデルの枠を離れて利用することができる。

 ボンフェロニの方法Bonferroni correctionは,ボンフェロニの不等式に基づいて各検定の有意水準を調整し,複数の検定全体の有意水準を事前に設定したレベル以下に制限する方法である。具体的には,検定全体での有意水準をαとすると,同時に考える検定の数に対して,それぞれの検定を有意水準α/Kで行なうことで調整する方法である。

 たとえば四つの水準間の平均の比較では,各回の検定の有意水準を5%ではなく,5/6≒0.83%とする。ボンフェロニの方法は,各検定が独立でない場合にも利用可能であり,各平均間の比較に検定でなくノンパラメトリック検定を利用すれば,データに正規性が仮定できない場合でも利用できる。相関係数の差の検定を繰り返し行なう場合などにも利用できる。

 しかし,同時に行なう検定の数が多くなると,検定力が落ちてしまうという欠点がある。

 検定力を向上させるためにボンフェロニの方法を修正した方法が,ホルムの方法Holm's procedureである。これは,たとえば同時に個の検定を考えるときに,

 ①個の各検定を値が小さい順に並べる。

 ②値が番目に小さい検定での有意水準をα/(+1)とする。

 ③値が小さい順から上記の有意水準で検定を行ない,初めて帰無仮説が採択された検定までは帰無仮説を棄却,それより大きい値の帰無仮説は採択する。

という段階を踏むステップワイズ法である。ホルムの方法は,ボンフェロニの方法より必ず検定力が高いことがわかっているので,近年心理学でもよく利用されている。

【分散分析の下位検定の多重比較】 分散分析での主効果の検定の帰無仮説は「その要因のどの水準にも差がない」という仮説である。主効果の検定が有意であれば,次のステップとして,実際にどの水準とどの水準には差があり,どの水準とは差がないのかを調べていく多重比較が行なわれることが多い。

 分散分析では通常データに正規性が仮定されるため,下位検定としての多重比較では正規性を仮定するものを利用するのが検出力の観点から望ましい。具体的にすべての水準間比較を目的とする方法としては,テューキーの方法Tukey's methodやテューキー-ウェルシュの方法Tukey-Welsch procedure,またはライアン-エイノット-ガブリエル-ウェルシュの方法Ryan-Einot-Gabriel-Welsch(REGW)procedureがある。対照群との比較を目的とする方法としてはダネットの方法Dunnetts testが,対比(第一群の平均μ1は第二群の平均μ2と第三群の平均μ3の平均に等しい,などといった平均値の線形結合)についての検定を目的とする方法としては,シェッフェの方法Scheffe's methodがよく利用される。

 反復測定の場合など,条件間で測定値に相関がある場合には,一般的には各水準間を比較するための検定統計量にも相関が生じるため,これらの方法は利用できず,有意水準を調整する方法が利用されることが多い。しかし,反復測定でも球面性の仮定が成立すれば,各検定統計量の相関がないと判定されるため,テューキーの方法やテューキー-ウェルシュの方法を用いてもよい。

 一元配置分散分析における主効果のF検定と,全条件間で差があるかどうかについての多重比較は,同じ帰無仮説であるため本来は同じ結果が得られるべきである。しかし,テューキーの方法など多重比較の方法によっては,この二つの結果に齟齬が生じることがある。近年では,分散分析の下位検定として用いる場合は,主効果の検定結果と齟齬が生じない方法(シェッフェの方法や,テューキー-ウェルシュの方法,さらにそのうちのF検定統計量を用いるREGW-F)を利用することが推奨されている。 →実験計画法 →統計的推論
〔星野 崇宏〕

出典 最新 心理学事典最新 心理学事典について 情報

今日のキーワード

黄砂

中国のゴビ砂漠などの砂がジェット気流に乗って日本へ飛来したとみられる黄色の砂。西日本に多く,九州西岸では年間 10日ぐらい,東岸では2日ぐらい降る。大陸砂漠の砂嵐の盛んな春に多いが,まれに冬にも起る。...

黄砂の用語解説を読む

コトバンク for iPhone

コトバンク for Android