デジタル大辞泉
「データマイニング」の意味・読み・例文・類語
出典 小学館デジタル大辞泉について 情報 | 凡例
データマイニング
データマイニング
data mining
データマイニングとは,大規模なデータセットからそこに潜在している価値のある情報(データの中に見いだすことができる新しく有用性があり,理解可能で確かなパターン)を得ることである。鉱山からの採掘にたとえてマイニングとよばれる。データマイニングでは,目的に応じてデータの要約,視覚化,分類,クラスタリング,特定の変数の予測や変数間の依存関係についてのモデル化,異常値や急激なデータの変化の探知などが行なわれる。販売店における購買データから特定の二つの商品が同時に売れることを見いだしたり,銀行における貸付データから倒産した企業の特徴を抽出したりするのはその一例である。よく用いられる統計学領域の手法には,種々の記述統計量の算出やデータの視覚化,判別分析,クラスター分析,回帰分析,主成分分析などがあるが,その多くは従来からある探索的データ解析exploratory data analysisの手法である。また,機械学習領域の手法の主なものには,決定木,相関ルール,ナイーブベイズ,ニューラルネットワーク,遺伝的アルゴリズム,サポートベクターマシンなどがある。
データマイニングのプロセスは次の五つに大別されるため,それぞれの代表的な処理について示すこととする。⑴データの選択:大規模に集まっているデータから目的に応じたデータを選んで利用できる状態にする。⑵クリーニングと前処理:ノイズを除去する。もしくはノイズ発生のモデル化を行なったり,ノイズ発生の理由を明らかにするための情報を収集する。欠損値の取り扱いを決める。変数の値のカテゴリを再検討する。必要に応じて数量データをカテゴリー化する。⑶データ変換:次元縮約や射影によって変数の数を減らしたり,関係のない変数を除去する。⑷探索的データ解析とパターンの発見:データマイニングのアルゴリズムやパターンの探索に利用する手法を選ぶ。分類,決定木,回帰分析,クラスター分析などの結果から興味あるパターンを探す。⑸解釈と評価:見いだしたパターンを解釈し,必要に応じて前のプロセスに戻る。以上を目的に応じて満足するまで繰り返す。
人工知能や機械学習の分野では,データマイニングはデータベースにおける知識発見knowledge discovery in databaseの過程の中のステップの一つとして位置づけられる。なお,両者をとくに区別せず,これらを総称して知識発見とデータマイニングknowledge discovery and data miningとよぶことも少なくない。テキストデータを対象とするデータマイニングを,とくにテキストマイニングtext miningという。 →回帰分析 →クラスター分析 →主成分分析 →テキストマイニング
〔吉村 宰〕
出典 最新 心理学事典最新 心理学事典について 情報
知恵蔵
「データマイニング」の解説
データ・マイニング
企業に日々蓄積される膨大なデータの中から有益な情報(仮説、課題、知見)を統計的手法の適用によって掘り起こすプロセスないしは手法。各種のデータを整理・加工し、それをデータウエアハウスに保管、そこから抽出されたデータを分析にかけ、知見を得るという一連のプロセスが自動化され、繰り返されることが理想。米国では1990年代半ば過ぎから、小売業、メーカー、金融機関などで用いられるようになった。例えば、小売業の場合、カード会員の購買データを用いてデータ・マイニングすることによって、文房具を買うとコーヒーも買うといった併買傾向が把握され、さらに、その顧客層の特性も明らかになる。このように、データ・マイニングでは、そうした傾向の背後にある理論はあまり問題とせず、とにかく実務上有益な関連性の把握や発見に力点が置かれる。
データ・マイニング
データベースに蓄積された膨大なデータの中から価値のある情報を引き出す作業を、鉱山から金や宝石などを採掘する行為に見立てた言葉。単純なデータ検索ではなく、複数のデータベースを連結して3次元以上の要素を持たせ、整列基準や表示範囲を変更するなどして隠れた関連性を見いだす手法が一般的。複数商品の売り上げデータから消費パターンを導き出したり、複数業種の株価推移の中から連動しているものを見つけ出すことなどに利用される。データベースソフトの機能を利用するほか、既存のデータベースを利用してデータ・マイニングを行うビジネスインテリジェンス(BI)ソフトもある。
出典 (株)朝日新聞出版発行「知恵蔵」知恵蔵について 情報
データマイニング
マーケティング手法の一種で、あるデータ群から潜在的な顧客のニーズを採掘(マイニング)する方法。小売店の販売データや電話の通話履歴、クレジットカードの利用履歴など、企業に大量に蓄積されるデータを解析し、その中に潜む項目間の相関関係やパターンなどを探し出す。情報技術の向上により、スーパーの販売データをデータマイニングで分析することで、「雨の日は肉の売上が良い」「ビールを買う客は一緒に紙オムツを買うことが多い」など、売上からは見えなかった商品同士の相関関係を見つけられるようになった。
出典 ASCII.jpデジタル用語辞典ASCII.jpデジタル用語辞典について 情報
データマイニング【data mining】
日々の企業活動から発生した膨大で多様なデータの中から有効な法則、傾向、パターンを導き出す手法。マイニングとは、鉱山の発掘、採掘という意味。文字通り、データの山からマーケティングに有効な金脈を発見するための分析手法の意味。基礎技術をもとにデータ・マイニング・テクニックが準備され、そのテックニックを活用してソリューション(課題解決)を実現する。課題は販促効果分析であったり、優良顧客プロファイル(「カスタマー・プロファイル」参照)の把握だったり、不正パターンの発見だったりする。
出典 (株)ジェリコ・コンサルティングDBM用語辞典について 情報
データマイニング
大量の販売データなどを様々な統計手法により分析することで、消費者の購買傾向や商品間の関連性を見つけ出す手法またはプロセスのこと。
データマイニングには様々な分析手法が存在しますが、マーケティングの観点から最も重要視するポイントは、顧客の特性や傾向分析と併買傾向分析があげられます。近年、市販の様々なツールが提供されるようになりましたが、分析して得られた仮説を元に、どのようなプロモーション戦略を構築するかが重要な課題となります。
出典 (株)マインズマーケティング用語集について 情報
データマイニング
データベースから,情報検索技術のみでは得難い法則,因果関係,パターンといった価値ある情報を導出するためのデータ処理技術.大規模かつ多種多様なデータベースの構築・運用が進む過程において,単なるデータ集計や情報検索の効率化だけではなく,統計学,論理学,人工知能などの広範囲にわたる技術を応用し,データあるいはレコード間に潜む規則性を発見し情報を導き出そうという研究から生まれた.1993年頃より米国で研究が盛んになる.
出典 図書館情報学用語辞典 第4版図書館情報学用語辞典 第5版について 情報
データマイニング【data mining】
大量のデータから有用な情報や知識を見つけ出す技術。企業が持っている大量の売り上げデータや顧客の購買履歴から、高度な統計分析を用いてマーケティングに役立つ情報を探り出すことなどを指す。
出典 講談社IT用語がわかる辞典について 情報
世界大百科事典(旧版)内のデータマイニングの言及
【情報科学】より
…この巨大なシステムの中で,データは静的受動的なものではなく,オブジェクトとして能動的に捉えられ,エージェントとして巨大なデータの中を探索する独立したプログラムが生成される。複雑なデータの集積から意味のある関係など有用な情報を抽象するデータマイニングという手法も発展してきた。安全なシステムを確立する上で暗号理論も重要な要素になってきている。…
【知識表現】より
…前者,共有・再利用可能な形式に整えられた知識をオントロジーという用語で呼ぶ場合がある。後者は,人工知能の機械学習やデータベース,統計手法との関連が強く,データベースからの知識発見(知識発掘),あるいはデータマイニングという用語で呼ばれている。 知識の表現は〈宣言的な知識〉と〈手続き的な知識〉とに大きく2分される。…
【データベース】より
… データベースに推論機能を付加したものを知識ベースという。また,データベースに隠れている貴重な情報を積極的に発掘しようというデータ発掘(データマイニング)や知識発掘の研究開発も盛んである。スーパーマーケットの売上げ伝票から,客の購入物品の思いがけない組合せ(たとえば〈豆腐を買う客は,牛乳もいっしょに買うことが多い〉)を見つけだせば,営業活動に利用できる。…
※「データマイニング」について言及している用語解説の一部を掲載しています。
出典|株式会社平凡社「世界大百科事典(旧版)」