一つの特性についてのデータのばらつきの大きさを,そのばらつきの要因別に分解することにより重要な要因を明らかにし,その影響の強さを知るための統計的方法の一つ。たとえば,米などの農作物の収量は,その品種,天候,土壌の性質,肥料の使い方などの影響を受ける。工業製品のできばえの特性は,原材料,作業者,製造機械,製造法などのそれぞれの違いによってばらついてくる。このようなばらつきの要因と考えられるもの(米の収量の場合には品種,天候,土壌,肥料など)を因子といい,一つの因子の中で取り上げる区別(品種の場合には個々の品種)を水準という。分散分析法は農事試験場での実験データの解析方法として発展し,その後広い分野で応用されるようになっている。真の要因を発見するためには実験計画法に基づいて因子間の水準の組合せのつりあいをとって実験を実施することが望ましい。たとえば,機械AとBによる製品寸法精度の違いを調べるのに,作業者アが機械Aを,作業者イが機械Bを常に操作してデータをとったのでは,機械の違いか作業者の違いかが分離できない(このような状況を一般に2因子の交絡という)。
分散分析をするデータは1因子のときは表1,2因子のときは表2のように整理され,それぞれ1元(配置)データ,2元(配置)データといわれることがある。この種の簡単な形式の場合のデータは日常的にもしばしば観察され,分散分析の方法を応用して解析し要因の影響を検討することができる。ただし,考慮に入れていない要因が存在して交絡している可能性にも配慮することが必要である。分散分析の結果は表3のような分散分析表としてまとめられる。そこで,データ全体のばらつきは各データの総平均値からの差の2乗の和,すなわち平方和ではかられ,表3の平方和の欄のように,その平方和が要因別に分解される。要因別の平方和は,その要因の水準別にデータを分けて水準別の平均値を求め,その間のばらつきとしてとらえられる。取り上げた要因で説明し尽くせない残りの平方和は,制御できない統計的誤差によるものと考えられる。その誤差による平方和に対して,各要因による平方和の大きさを不偏分散の比によって比較し,各要因の影響の強さが統計的に推測される。要因の影響が強いということは,もとのデータのばらつきにその要因が寄与していること,言い換えれば,稲の品種によって収量に大きい差が出るように,その要因の水準の違いによって目的とするデータの値が大きく異なってくることを意味する。さらに,分散分析法では,各データを,
総平均+使用した水準の効果+誤差
の形に分解することができ,どの水準の組合せがよいか,誤差に異常のあるものはないかなどの問題を統計的に検討することができる。
執筆者:吉沢 正
出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報
出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報
出典 (株)トライベック・ブランド戦略研究所ブランド用語集について 情報
《〈和〉doctor+yellow》新幹線の区間を走行しながら線路状態などを点検する車両。監視カメラやレーザー式センサーを備え、時速250キロ以上で走行することができる。名称は、車体が黄色(イエロー)...
12/17 日本大百科全書(ニッポニカ)を更新
11/21 日本大百科全書(ニッポニカ)を更新
10/29 小学館の図鑑NEO[新版]動物を追加
10/22 デジタル大辞泉を更新
10/22 デジタル大辞泉プラスを更新