データマイニング、バスケット分析、クレジット加入審査
マイニング(mining)とは、鉱山用語で金脈などを探索することです。データマイニングとは、大量のデータを分析することにより、貴重な情報を発見するための技術です。一般に高度な統計学の手法を駆使していますが、その操作方法や出力デザインを工夫して、使いやすくしたソフトウェア製品が多く市販されています。 ☆
多次元データベースによるOLAPとデータマイニングは,似ているところもありますが,次のような違いがあげられます。
| OLAP | データマイニング | |
|---|---|---|
| データ量 | 比較的小さい | 極めて巨大 |
| 処理内容 | 単純計算 | 高度な統計学 |
| 処理形態 | かなり定型的 | 毎回異なる |
| 処理方法 | 利用者が指示 | ツールの選択 |
| 結果の解釈 | 実務知識が必要 | 統計学の知識も |
| 利用者 | 各部門の素人が使う | 特定部門の専門家 |
| 利用頻度 | 非常に多い | それほど多くはない |
| 利用環境 | データマート | データウェアハウス |
データマイニングの適用例として代表的なものを以下に掲げます。
有名な例として,「紙オムツやベビーミルクとビールの併売」があります。米国では奥さんに頼まれてダンナが車でスーパーに買いに行くのが通常ですが,そのときに赤ちゃんのものだけでなく自分用にビールをケースごと買って行くのだと説明されています。でもこれは「伝説」でしょう。
発展:「データマイニング」(kj3-datamining-x)