改訂新版 世界大百科事典 「判別分析」の意味・わかりやすい解説
判別分析 (はんべつぶんせき)
discriminant analysis
ある個体が複数の群や集団のいずれに属するかを多変量データに基づいて統計的に判別するとともに,その判別方式の妥当性を分析する多変量解析法の一つ。各群や集団については,それぞれの群に属することがわかっている相当数の個体に関し多変量データ,すなわち特性に関するデータが複数観測されていることを前提とする。そのデータを参照データともいい,各群ごとの参照データの分布状況を参照して新しく観察された個体の所属を判別する。たとえば,ある遺跡で発掘された人間の顎骨(がくこつ)が各部位の寸法などの測定値からみて男性のものか女性のものかを判別したい場合とか,多数の中小企業に貸付けを行う銀行で貸付けを申し込んだ企業について,その企業の利益率や資産のデータからゆるい審査で済ます優良企業と,詳しい調査の上で審査すべき非優良企業の二つの群に判別したい場合など,判別分析は多くの分野で活用されている。判別方法としてはR.A.フィッシャーによる判別関数がよく利用されている。
判別の基本的考え方は,判別したい個体と各群との距離を定義して,その距離で最も近い群に属すると推定することである(図参照)。参照する特性が一つの場合,統計的な距離は
(個体測定値-群平均値)/(群の標準偏差)
で測り,一般にはこれを拡張したマハラノビス距離を用いることが多い。判別方法のよさは,その方法を実際に何度も利用してみないと判断できない点もあるが,参照データ自体を正しく判別する割合,あるいは逆に誤判別の割合が評価されることである。しかし,判別方式そのものが参照データをできるだけ正しく判別するように作られるので,将来に関する個体の判別能力としては過大に評価している危険がある。そこで参照データの1個体ごとに,それを除外した残りを参照データとする同じ判別方式を作って,除外した個体の判別を行う。これをすべての個体について実行したときの誤判別の割合を求めて判別方式の評価を行う。この評価法を〈一つとっておき法〉などということもあり,有効なものである。
執筆者:吉沢 正
出典 株式会社平凡社「改訂新版 世界大百科事典」改訂新版 世界大百科事典について 情報