Web教材一覧システムの活用

データマイニング

キーワード

データマイニング、バスケット分析、クレジット加入審査


マイニング(mining)とは、鉱山用語で金脈などを探索することです。データマイニングとは、大量のデータを分析することにより、貴重な情報を発見するための技術です。一般に高度な統計学の手法を駆使していますが、その操作方法や出力デザインを工夫して、使いやすくしたソフトウェア製品が多く市販されています。

多次元データベースによるOLAPとデータマイニングは,似ているところもありますが,次のような違いがあげられます。

 OLAPデータマイニング
データ量比較的小さい極めて巨大
処理内容単純計算高度な統計学
処理形態かなり定型的毎回異なる
処理方法利用者が指示ツールの選択
結果の解釈実務知識が必要統計学の知識も
利用者各部門の素人が使う特定部門の専門家
利用頻度非常に多いそれほど多くはない
利用環境データマートデータウェアハウス

データマイニングの適用例として代表的なものを以下に掲げます。

バスケット分析
スーパーなどの薄利多売を特徴とする小売店では、一人あたりの売上を増大させるために、ある商品Aを買ったついでに他の商品Bも買ってもらうように工夫することが必要です。そのためには、バスケット(買い物カゴ、実際にはPOSデータ)を分析して、何と何を一緒に買うことが多いかを発見し、AとBを隣接したコーナーに陳列することが効果的です。

有名な例として,「紙オムツやベビーミルクとビールの併売」があります。米国では奥さんに頼まれてダンナが車でスーパーに買いに行くのが通常ですが,そのときに赤ちゃんのものだけでなく自分用にビールをケースごと買って行くのだと説明されています。でもこれは「伝説」でしょう。

クレジット加入審査
クレジットカードを用いたのに後日支払をしない客を不良客といいますが、そのときにはクレジット会社の損失になります。不良客の加入を避けるために、クレジット会社では加入時に、年齢、性別、職業、持ち家などのデータにより審査をします。優良客と不良客の違いの特徴を、過去のデータを分析することにより、合理的な審査基準を作成できます。その分析に、データマイニングが用いられています。
インターネットアクセスの分析
BtoCでは、そのWebサイトにどこから(直接に、ポータルサイトから、バナー広告から)来たのか、購入までにページをどのように動いたかなどを記録して分析することにより、効果的な広告の出し方やWebページの工夫に活用できます。大量の記録データから、購入に関係する要因を発見するために、データマイニングは強力なツールになります。

発展:「データマイニング」(kj3-datamining-x)


本シリーズの目次へ