Web教材一覧システムの活用情報検索系システム

BIとエンタープライズサーチ


ECM、BIの概念

ECM(Enterprise Content Management)とは、「組織内の非構造化情報がそれがどこに保存されていても管理することができる」ことを目的とした概念です。企業内外に蓄積されている情報を体系的に整理して、エンドユーザが多様な検索・加工をする利用形態です。
 従来のデータウェアハウスの拡張概念だともいえます。その拡張した分野とは、データウェアハウスがほとんど構造化情報(数値データ)を対象としていたのに対して、BIでは非構造化情報(文書や画像など)も合わせて扱い、それらを一元管理することにあります。また、社内情報だけでなく、インターネットを介して社外情報も対象にしたりクラウドサービスと連携したりしています。

ECMに似た用語にBI(ビジネスインテリジェンス)があります。両者の相違は曖昧ですが、ECMが概念であり、BIはそれを支援するソフトウェア群や実装環境だといってよいでしょう。BIのほうが一般に流通しているので、ここでは両者を合わせてBIとします。

BIの構成

BIは、1990年代後半から注目されるようになり、2000年代中頃から広く普及するようになりました(経緯)

ガートナー社(著名なIT関連の調査・コンサルティング会社)は、1989年に「エンドユーザーによる自由なデータ分析を実現するためのインフラストラクチャとアプリケーションの総称であり、従来型の意思決定支援システム (DSS)、OLAP (多次元データ分析)、EIS(役員情報システム) が含まれる。」概念をBIと命名しました。
 当時は、インターネット普及以前でしたので、この定義ではデータウェアハウスと同じ、あるいは、データウェアハウスを利用するための環境を含む上位概念のように思われます。実際、従来のデータウェアハウスのことをBIという新用語を用いている場合もありますし、OLAPツールデータマイニングツールのことをBIツールと称している場合もあります。
 また、その後、ダウンサイジングおよびイントラネットの進展に伴い、汎用コンピュータをTSSでアクセスしていた環境をオープン系環境に移行するために、多種多様なコンピュータに蓄積されているデータを、1台のパソコンから統合して検索加工する必要が高まり、それを支援するツールが出現してきました。
 上記の定義ではデータ分析に限定されていますが、グループウェアなどの普及により、文書・画像データを用いた情報共有・情報検索が重視されるようになりました。これらを統合した利用環境が必要になります。
 ここでは、これら全体を含めた利用形態をBIということにします。

BIは、OLAPツールやデータマイニングだけでなく、基幹業務系システムからの出力帳票や電子メールなどの情報を、エンドユーザの担当業務に合わせて整理し、ブラウザの初期画面に表示します(画面例)。いわば、エンドユーザの業務ポータルサイトになります。

ETL(Extract、Transform、Load)
ODS(Oparational Data Store)に似た概念です。企業内外にあるデータは、順編成ファイルやリレーショナルデータベースなど多様な形式になっています。それらのデータから必要な部分を抽出して一定の形式に変換し、データウェアハウスなどにロードする作業を支援する機能です。データウェアハウスの運営を支援するために発展しました。
EAI(Enterprise Application Integration)
データマッピングともいいます。企業内外にあるデータは、多数のコンピュータに分散されており、それをアクセスするプログラムは、汎用コンピュータ、Windows、UNIXなど多様なOSの下で管理されています。これら分散する各システムからデータ形式やプロトコルの違いを超えて、アクセスできるインタフェースを実現するためのソフトウェアです。ETLも含めてEAIということもあります。
従来、汎用コンピュータから出力される帳票類を、オープン系でのパソコンにブラウザで表示させる必要から発展しました。
EIP(Enterprise Information Portal)
社内ポータル、ダッシュボードともいいます。BIでのヒューマンインタフェースを支援する機能です。上記のようなツールにより蓄積されているデータベースを、利用者の権限や利用頻度に合わせて最適な情報を選択し、パソコンを立ち上げたときの最初の画面にします。これには、電子メールやWeb閲覧、カレンダー(ToDoリストなど)も含まれます(社内ポータル例)。
なお、企業内での情報共有を進めるに際して、情報の所在やアクセス方法、情報の所有者などをポータルにしたものをナレッジポータルといいます。

BIの効果と留意点

BIは、データウェアハウスやグループウェアを統合したものですから、それらの利点や問題点をそのまま継承しています。BIにより、特にそれらの問題点が解決されるものではありません。ここでは、BIの特徴により生じる効果と留意点を列挙します。


企業内の多様な情報だけでなくWebサイトでの関連情報を統合し、検索する機能あるいは概念です。
企業内の検索エンジンであり、データウェアハウスやBIの拡大発展、ナレッジマネジメントの情報活用でもあります。

データウェアハウスでは、販売データのような構造的数値データに限定されていました。BIではSNS投稿のような非構造的文字データ、なかには画像なども扱うようになりましたが、主に社内で発生するデータでした。それに対して、エンタープライズサーチでは、社外のオープンデータやWeb情報なども対象にしています。
 データウェアハウスやBIでは、対象とするデータにより加工方法や操作方法がまちまちでした。エンタープライズサーチでは、広く用いられている検索エンジンのキーワード検索に似た操作に合わせるようにしています。それにより、より多様な検索加工ができるようになりました(最初の検索をこの方法で行い、対象が決まれば個々のアプリケーションを呼び出すことにより操作性を高めることもあります)。
 また、RSS機能(更新情報の配信機能)を用いて、関係者に最新情報を送信し、情報の共有化の高度化を図る機能をもつものもあります。

cognitiveとは「認知」のこと。ある事象についてコンピュータが自ら考え、学習し、自らの答えを導き出す機械学習やAIの一分野です。コグニティブサーチとは、エンタープライズサーチに機械学習を加えたものです。
 例えば、クレーム件数の推移の検索に続いて、クレームの内容や適切な対処などをAIで分析した結果を得るなどができます。
インサイトエンジン(Insight Engine)
このような機能をもつ検索エンジンは、通常の検索エンジンとは異なる仕組みで設計する必要があります。それをインサイトエンジンといいます。また、エンタープライズサーチの実装はインサイトエンジンが主になるので、エンタープライズサーチのことをインサイトエンジンということもあります。