統計的検定(読み)とうけいてきけんてい(英語表記)statistical test

改訂新版 世界大百科事典 「統計的検定」の意味・わかりやすい解説

統計的検定 (とうけいてきけんてい)
statistical test

事物の集合を定量的に比較する目的で用いられる数理統計学の方法を統計的検定(または検定)という。応用としては,例えば,化学反応の収率を上げる目的で使用する触媒の比較とか,現在の日本の成人男子の身長を10年前と比較するとか,あるいは,ある病気に対する2種の治療法を比較するなど数多くの例を挙げることができる。この場合,収率,身長など比較したい事物の集合を母集団といい,無作為にとった少数の標本に基づいて元の母集団を比較するという形式をとる。母集団の記述にはいろいろな方法が考えられる。もっとも単純なのは母集団の要素をすべて書き出すことだが,これは要素数が大きいときには不可能である。むしろ平均やばらつきなど,少数の特性値でおおづかみに記述するほうが便利かつ現実的である。さらに収率や身長のように連続値をとり,単峰かつ対称で平均から極端に隔たる要素が存在しないと思われる場合には正規分布を仮定することができる。平均μ,分散σ2の正規分布N(μ,σ2)の密度関数は,で与えられる。これはμを中心とし,富士山を投影したような形をしている。

 正規分布を仮定すると母集団の比較はパラメーターに関する仮説検定の問題として定式化することができる。次のデータはある食品会社の製品濃度の10個の測定値である。

 データ:9.1,8.1,9.1,9.0,7.8,9.4,

  8.2,9.1,8.2,9.3(単位%)

この製品について標準値がμ0=8.5,σ0=0.5とされている。このデータに基づいて母集団の平均が標準値に合致しているかどうかの検定は次のように行う。

 検定したい仮説は,

 H0:μ=8.5

である。これをとくに帰無仮説という。一方,標本の平均は,

 x=(9.1+8.1+9.1+9.0+7.8+9.4+8.2+9.1+8.2+9.3)÷10=8.73

である。標本の平均は確率変数だから,その一つの実現値である8.73が標準値に一致しないからといって仮説H0が真でないということにはもちろんならない。H0を真と考えるか否かの判定を,x=8.73がH0の下での確率分布の実現値として自然な値なのか,あるいはきわめて珍しい値で,むしろ母平均が8.5とは異なるある値μ1と考えるほうが自然なのかによって行うのが統計的検定である。この場合,帰無仮説に対して想定する仮説,

 H1:μ=μ1

対立仮説という。対立仮説としては,H0での値と異なるすべての値を想定して,

 H1′:μ≠8.5

とすることもある。H1′の下ではμの値によって複数の確率分布を考えることになるのでとくに複合対立仮説と呼ぶ。複合対立仮説としては,

 H1″:μ>8.5やH1:μ<8.5

のようにH0での値より大きいほうまたは小さいほうだけを考えることもある。H1′を両側対立仮説H1″を右片側対立仮説H1左片側対立仮説と呼んで区別する。

 検定方式としては帰無仮説が真のときにはそれを採択する確率がなるべく大きく,逆に対立仮説が真ならば帰無仮説を棄却する確率がなるべく大きいことが望ましい。

 一般に,x1,……,xnが正規分布N(μ,σ2)に従うとき,平均xは正規分布N(μ,σ2/n)に従う。そこでx=8.73がH0の下での分布N(8.5,0.52/10)の実現値として自然な値か否かを考える。まず対立仮説としてH1を考え,μ1が8.5より大きなある値とするとxが不自然に大きいと思われるときにH0を棄却することになる。対立仮説として右片側対立仮説H1″を考えるときも同様である。いま,正規分布N(8.5,0.5/102)に従う確率変数Yが8.73より大きな値をとる確率は,

である。ただし,記号prはprobabilityの略で,( )内の事象が起きる確率を表す。Yを規準化したU標準正規分布に従うので,最後の値は正規分布表から求めることができる。確率0.074はかなり小さいがきわめて珍しいというほどでもないだろう。次に,両側対立仮説H1′を考えるときには,xが8.5から下方に大きく隔たってもH0を棄却すべきである。H0の下でxが下方に2.3以上隔たる確率も先と同様に0.074である。したがってH0の下でxが8.5から±0.23以上隔たる確率は約0.148,いいかえると100回中15回くらいある。これはそう珍しい事象とはいえない。ここでこれらの確率の大きさをどう評価するかが問題になるが,ふつうは0.05および0.01を規準とし,0.05以下のときは有意,0.01以下のときは高度に有意といってH0を棄却する。規準にとる0.05や0.01などは検定の有意水準という。これはまた,H0が真のときに誤って棄却する確率でもあり,この意味では危険率と呼ぶ。

 検定の有意水準αを定めると,あらかじめある領域を設定し,観測値がその領域に属せばH0を棄却するという検定方式をとることができる。この領域を有意水準αの棄却域と呼ぶ(図)。N(0,12)の上側α点をKαと置くと,上の両側検定の例についてH0の下で標本平均xについて,が成り立つから,のとき,有意水準αでH0を棄却すればよい。Rが棄却域である。この式は観測した差の絶対値|xa-8.5|がを超える確率はH0の下ではたかだか確率αでしかないと解釈することができる。α=0.05とするとK005/2=1.96だからR右辺は0.31となる。したがってx=8.73は棄却域に属さない。一般にσ0既知の場合に,平均に関する仮説H0:μ=μ0に対する有意水準αの両側検定の棄却域は次で与えられる。この検定において真の平均が,μ1(≠μ0)であるときに,H0を棄却する確率を検出力という。検出力は増加関数である。μ1とμ0の差が大きいほど,ばらつきの小さいほど,また標本サイズの大きいほど検出力は高くなる。ここで述べた両側検定はμ0から上下どちらに乖離(かいり)しても同じように検出するように作られているが,上下どちらか一方向だけの乖離を想定する片側検定の場合は棄却域も片側になる。たとえば,右片側対立仮説H1″の場合には,有意水準αの棄却域は次のようになる。平均に関する検定を行う際,ふつうは分散が未知なので,σ0のかわりに標本x1,……,xnによる推定値,

を用い,次のtを検定統計量とする。tH0の下で自由度n-1のt分布に従うので,有意水準αの両側検定の棄却域は次のようになる。ただし,tα/2n-1)は自由度n-1のt分布の両側α点であり,t分布表から求まる。次に食品会社Bについてデータ,

が得られているときに,A,B2社の母平均に差がないという帰無仮説を有意水準αで検定するためのt検定の棄却域は,

で与えられる。

 このほか,分散に関する仮説の検定も同様の考え方で構成することができる。

 母集団に想定する分布はいつも正規分布とは限らない。信頼性の分野で寿命や故障時間を対象とするときには指数分布やワイブル分布を想定することが多いし,事故件数や病気の治癒の有無など離散データを対象とするときにはポアソン分布や二項分布などの離散分布が用いられる。さらに特定の母集団分布を仮定しないで,平均的な大小関係を論ずるノンパラメトリック法もある。
執筆者:


出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報

ブリタニカ国際大百科事典 小項目事典 「統計的検定」の意味・わかりやすい解説

統計的検定
とうけいてきけんてい
statistical testing

母集団に関する仮説を標本から得た情報に基づいて検証すること。普通は単に検定と呼ばれている。社会調査においては標本調査と全数調査とを問わずデータには偶然的誤差が含まれているので,ある結論を下すためにはそれが偶然的要因によるものでないことを統計的検定によってテストしなければならない。この手続のあらすじは,(1) 母集団に関して証明したい命題とは逆の仮説 (帰無仮説) を立てる,(2) その仮説が正しいとしたときの,ある統計量の標本分布を考える,(3) 調査結果からその統計量の値を計算する,(4) そのような値が帰無仮説のもとに無作為に出現する確率を,標本分布の形から数表を使って割出す,(5) この確率の値があらかじめ定めておいた有意水準 (普通5%) より小さければ,もとの仮説を棄却し,大きければ仮説の判定を保留する。こうした手続により検定が行われるが,より簡単な方法としては片側検定というものもある。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

今日のキーワード

スキマバイト

働き手が自分の働きたい時間に合わせて短時間・単発の仕事に就くこと。「スポットワーク」とも呼ばれる。単発の仕事を請け負う働き方「ギグワーク」のうち、雇用契約を結んで働く形態を指す場合が多い。働き手と企...

スキマバイトの用語解説を読む

コトバンク for iPhone

コトバンク for Android