Fascination N−D−File データウェアハウス

戻る

データウェアハウス(DataWareHouser:DWH) 直訳すれば、データの倉庫という意味。

概要

複数の基幹系システム(mainframe:スーパーマーケットのPOS 、製造管理システム、販売管理システム、会計システムなど)から、トランザクション(取引)を抽出して、再構成(Re-structure)・再蓄積(Re-store)したシステム。

必要性

データウェアハウスの登場は、1990年代にハードディスクが安くなったことと、PCやサーバで使用可能な安価なCPU(Central Processing Unit)を並列で使用する技術ができてきたことによる。ただし、この時代はまだ基幹系システムのCPUやハードディスクは高止まりしていたので、データウェア専用のハードウェア(Hardware)やソフトウェア(Software)が開発(Release)されていった。

提唱者とその内容

データウェアの提唱はビル・インモン(William H. Inmon)氏で、1990年の著作によれば、「データウェアハウスは、意志決定(Decision)のため、目的別(Purpose-oriented)に編成され、統合化(Integration)された時系列で、削除(Delete)や更新(Update)しないデータの集合体」とされる。

特徴

基幹系システムでは、いま現時点での状況が把握できればよいので過去のデータは基本的に保持しない。短ければ半期、長くても1年で個別データ(Atom)からサマリ(Sammary data)に更新している。このため基幹系システムでは業務量が増大しない限りは、現状のディスク容量で破綻しない。

これに対してデータウェアハウスではデータを削除しない為、月々データボリュームが増大する。データウェアハウスでデータの削除や更新をしないのは、現在と過去を比較する為であり、ある顧客Aさんが過去どのような買い物をして、さらに今後ともその程度の購買が期待出来るのか、と言う判断をする為である。

後続の分析システム

これまでデータウェアハウスは、複数の基幹系からデータを送信してもらいそのデータを蓄積してきたが、当然のことながらデータは分析して意志決定に役立てるものである。

データウェアハウスの後続のシステムとしては、データマート(data mark)が存在する。その名前の通り、データウェアハウスはデータの倉庫であり、データマートはデータの小売店を意味している。実際の分析をする場合は、データの最小単位(atom)を使うのではなくて、適宜に集計されたデータを使用する方が速いので、エンドユーザ(End User:最終利用者)が使うデータを事前に見極めておいて、データウェアハウスからデータを集計しデータマートを構築。エンドユーザは、ツールを使って必要なデータやレポートを作成する。

データを実際に分析するのは、OLAP(OnLine Analytical Processing)もしくはデータマイニングツールを使用。データウェアハウスをMS Accessで分析する人もいるが、極く少数派である。

inserted by FC2 system