出典 最新 心理学事典最新 心理学事典について 情報
n個の個体があり、そのおのおのについてp種の変量x1、……、xpが観測されているとする。x1、……、xpのうちの二つの変量の間の相関関係は全部で、pC2個あるが、これらをもとにして、x1、……、xpの間の全体的関係を統計的に解析するのが多変量解析である。多変量というのは、問題にする変量がいくつもあるからである。
コンピュータの発達と普及に伴い、とくに社会科学の分野において多変量解析の手法が広く用いられるようになった。多変量解析には、主成分分析、因子分析、判別分析、正準相関分析などいくつもの手法があるが、これらの手法についてのプログラムが統計解析パッケージの一部として多くのコンピュータに準備されている。しかし複雑多様な現実問題に対して完全な解答を与えるところまで理論が進歩しているわけではない。形式的な計算結果だけを過信することは危険であって、問題の定式化の妥当性についての十分な吟味が必要である。次に、主成分分析および因子分析について簡単に説明する。
[古屋 茂]
この方法はp個の互いに相関をもつ変量x1、……、xpのもつ情報を、pより小さいm個の互いに相関のない変量z1、……、zmに要約しようとするものである。
z1、……、zmは次のようにして定める。変量xiをすべて平均値が0、分散が1であるように標準化しておく。xiとxjの相関係数を(i,j)成分とするp×p行列をx1、……、xpの相関行列という。この相関行列の固有値を大きいほうから順にm個とって、λ1、……、λmとし、固有値λiに対応する固有ベクトルの第j成分をlijとする。このlijを用いて
z1=l11x1+……+l1pxp
z2=l21x1+……+l2pxp
…………………
zm=lm1x1+……+lmpxp
によってz1、……、zmを定めるのである。このziを第i主成分という。こうして得られたz1、……、zmは互いに無相関になっている。
[古屋 茂]
この方法の目的は、多くの変数の間にある相関関係を分析して、それらの変数の背後にある潜在的共通性を探ることにある。潜在的共通性といっても一般的な形では取扱いが困難なので、与えられた変量の一次結合で表されるものを考える。観測される変量がp個あるとして、それらをx1、……、xpとする。これらの変量のおのおのは、比較的少数の直接には観測されない変量y1、……、yqによって次の形に表されているものと仮定する。
x1=a11y1+……+a1qyq+d1
x2=a21y1+……+a2qyq+d2
…………………
xp=ap1y1+……+apqyq+dp
ただし係数aijは未知の母数である。また変量y1、……、yq、d1、……、dpは統計的に独立であると仮定する。y1、……、yqを潜在共通因子といい、d1、……、dpを特殊因子という。
ここでx1、……、xp、y1、……、yqはすべて平均値が0、分散が1と標準化されているものとする。aijを(i,j)成分とするp×q行列をA、x1、……、xpの相関行列をRとすると
(*) R=AtA+Δ
ただしΔは(i,i)成分がd2iの平均値であるようなp次対角行列である。なお、
h2i=a2i1+……+a2iq
と置くと=1-h2iであって、h2iを共通度とよぶ。われわれが知りうるのは行列Rだけである。このRが前記の式(*)のように分解できるように、共通因子の数q、行列Aを推定し、これらの推定値を用いて共通因子yiの値を求めようというのが因子分析の考えである。
[古屋 茂]
『ケンドール著、浦昭二・竹並輝之訳『多変量解析の基礎』(1972・サイエンス社)』▽『柳井晴夫・高根芳雄著『新版 多変量解析法』(1985・朝倉書店)』
多変量,すなわち多数の統計的変量の,相互依存関係や従属的関係の解析を目的とする統計的手法とその理論の総称。20世紀初めから,F.ゴールトン,K.ピアソン,R.A.フィッシャー,マハラノビスP.C.Mahalanobisらによって生物学の分野に,C.E.スピアマン,サーストンL.L.Thurstone,H.ホテリングらによって計量心理学などの分野に先駆的に導入され,最近ではコンピューター利用の急速な発展により,統計処理が容易に行えるようになったことによって,工程解析,市場分析,品質解析,財務分析,社会調査,計量診断,薬効検定などへ広く活用されている。歴史的には,1変量の正規分布を前提とする平均や分散に関する推定や検定の理論を多変量正規分布の場合に拡張する研究が先行したが,現在では,n個の対象のおのおのについてp種類の変数の値が観察されている形式を基本とする多変数データを実際的に解析する種々の手法が開発されている。回帰分析,判別関数(判別分析),主成分分析,因子分析,クラスター分析などが主要な手法であり,ほかに,正準相関分析(相関分析),多次元尺度構成法,数量化理論,潜在構造分析などが含まれる。時間的変化を追う時系列データの解析手法や,機械の寿命とか生物の生存に関するデータの解析などは,多変数データであっても多変量解析に含めないのが普通である。しかし,そのような区別は便宜的なものであって,データ解析は目的に即した総合的な立場で進めるべきものであろう。
解析したい多変数データは,計画的実験によるデータや無作為抽出を経た標本調査のデータの場合より,むしろ日常的に観察されているものが多い。例えば,製鉄所の一貫した工程で作られた鉄板の種々の製品特性は,工程条件や原料のデータとともに記録され,その記録されたデータにもとづいて解析されている。そこでは,工程条件を実験的に大幅に変化させることはできず,モデルの探索や製品特性の予測は大変困難であるが,注意深いデータの吟味と適切な回帰分析の利用によって新製品の開発にまで効果をあげている。考古学者は,たまたま発掘された人骨や土器・装身具類について,種々の特性を測定した多変数データによって分類や人種,時代等の判別を行っている。企業の財務分析家は,多数の企業の売上高,原価,利益,資本,負債,従業員数などの多くのデータを調査し,企業の財務状況を総合的に評価する指標を主成分分析を利用して作り出している。現在では,多変数データを用意すれば,標準的手法についての必要な計算を行ってくれるコンピューター用ソフトウェアが使用できるようになっており,道具として使いこなすことが必要である。
執筆者:吉沢 正
出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報
出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報
出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報
出典 (株)トライベック・ブランド戦略研究所ブランド用語集について 情報