日本大百科全書(ニッポニカ) 「データマイニング技術」の意味・わかりやすい解説
データマイニング技術
でーたまいにんぐぎじゅつ
データからなんらかの知見を取り出す技術。データベースを利用してなんらかの知見を引き出すには、まず仮説をたて、データベースを検索することでその仮説を検証しなければならない。これに対してデータマイニングでは、仮説をたてずに、際だった特徴を示すデータを自動的に探索する。大量の仮説を自動的に生成してこれらを一つずつ検索すれば、このような探索は原理的に可能だが、それまでのデータベース検索の技術では時間がかかりすぎて不可能だった。1994年に当時IBMの研究者だったラケシュ・アグラワルRakesh Agrawalが効率的なアルゴリズムを開発し、これをデータマイニングとよんだことで技術が確立された。データマイニングではなんらかの強い相関を示すデータ項目をみつけるが、それをどのように解釈するかは人間次第である。データマイニングの成功例として喧伝(けんでん)される「金曜日の夜におむつを買う若い男性はビールも買う」という相関は、相関としてはそのとおりだが、おむつとビールを並べて陳列すれば売上げが伸びるかといえば、そうとも限らない。データマイニングの結果を効果的に使えるかどうかは、このように利用者に依存する。
[丸山 宏 2019年4月16日]