クラスター分析(読み)くらすたーぶんせき(英語表記)cluster analysis

日本大百科全書(ニッポニカ) 「クラスター分析」の意味・わかりやすい解説

クラスター分析
くらすたーぶんせき
cluster analysis

さまざまな性質が混在するデータを、客観的な数値基準に従っていくつかの集団クラスターcluster)に分けて、類型化することにより対象の特性を分析する手法総称。クラスターとはブドウの房や集落の意。科学的に複数集団に分類するため、先入観慣例による恣意(しい)的な分類を排除できるという特徴がある。広くマーケティングに活用されており、たとえば消費者が商品を選ぶ際にどのような点を重視するかを調査し、「高級志向派」「堅実派」「流行追求派」といった各クラスター(消費者集団)の特徴ごとに商品開発や販売促進策を進めるという手法がとられる。このほか検査値に基づく疾患の分類、市町村の交通圏・文化圏といった地理的分類による市町村合併や選挙区の区割り、マニフェストによる政党党派の分類、絵画などの芸術作品や手紙・文章の真贋(しんがん)判定、考古学で発掘された人骨遺物の分類など幅広い分野で活用されている。

 クラスター分析は、グループ分けのための計算手法の違いで、大きく「階層的手法」と「非階層的手法」の二つに分けられる。階層的手法は似たデータどうしをまとめていき、いくつかの集団にわける手法をとる。代表例には、一定の基準に従ってもっとも類似したデータどうしから集めていく「最短距離法」、もっとも遠いデータから集めていく「最長距離法」、クラスター内のデータの平方和を最小にする「ウォード法」などがある。一方、非階層的手法はあらかじめ決めておいたクラスター数にデータを分割していく方法をとり、代表的手法に各クラスターに含まれる各標本点とそのクラスターの重心との近さを計算していく「k平均法(k-means法)」がある。階層的手法は分析結果を樹形図(デンドログラム)に表示できるという特徴があり、樹形図をみながら集団の数を決められるという利点があるが、分類対象が多い場合には計算量が膨大になるという欠点がある。これに対し、非階層的手法は大量のデータ分析に向いているが、クラスター数を任意に設定するため、集団の数によって分析結果が大きく左右されるという欠点がある。

[矢野 武 2016年6月20日]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

ブリタニカ国際大百科事典 小項目事典 「クラスター分析」の意味・わかりやすい解説

クラスター分析
クラスターぶんせき
cluster analysis

多数変数あるいは測定対象があるとき,それら相互間の相関係数やそのほか適当な類似度を示す指標を要素とする行列を基礎にして,いくつかのまとまり (クラスター) を発見する方法。因子分析の予備として行う場合が多い。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報