データマネジメント基礎

データウェアハウス/BI入門 — 分析基盤と意思決定支援

導入

「先月の売上が部門ごとに集計されたダッシュボードを朝イチで確認する」――こうした光景は多くの企業で日常になっています。このような分析環境を支えているのがデータウェアハウスとBIの仕組みです。

くわしく知ろう

データウェアハウス(DWH)とは、分析目的のために社内の複数システムからデータを統合・蓄積する大規模なデータベースのことを指します。W・H・インモン氏が提唱した定義では、主題指向(テーマ別に整理)・統合(複数ソースを一元化)・時系列(時間軸での変化を保持)・非揮発性(更新や削除をせず蓄積する)という4つの特徴を持つとされています。

業務システムが使うOLTP(Online Transaction Processing)は、注文・在庫更新などのリアルタイム処理に特化しています。一方、DWHで使われるOLAP(Online Analytical Processing)は、大量の履歴データを対象に集計・傾向分析を行う処理を指します。この2つは目的が異なるため、多くの組織では別のシステムとして運用されています。

DWHにデータを投入するプロセスをETL(Extract・Transform・Load)と呼びます。各システムからデータを抽出(Extract)し、形式を変換・クレンジング(Transform)してから、DWHに格納(Load)する流れになっています。

データマートとは、DWHから営業部門・経理部門などの特定の用途向けに切り出した、小規模な分析用データベースを指します。部門ごとに必要なデータのみを保持するため、利用者にとって使いやすい構造になっています。BIツールはこうしたデータをダッシュボードやグラフで可視化し、意思決定を支援するソフトウェアの総称です。

具体例

たとえば小売チェーンでは、各店舗のPOSシステムからETLで毎晩データを収集しDWHへ格納します。そこから「東日本営業部向けデータマート」を作成し、BIツールで店別・商品別の売上ダッシュボードとして可視化するという流れが典型的です。

まとめ・試験ポイント

  • DWHの4特徴=主題指向・統合・時系列・非揮発性
  • OLTP=業務処理(リアルタイム)、OLAP=分析処理(大量の履歴データ)
  • ETL=Extract(抽出)→Transform(変換)→Load(格納)の3ステップ
  • データマート=DWHから部門別に切り出した分析用データベース
  • BIツール=データをダッシュボード・グラフで可視化して意思決定支援
  • 試験では「OLTPとOLAPの違い」「ETLの順序」がよく問われる

学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。

入門試験100問に挑戦する