データウェアハウス/BI入門 — 分析基盤と意思決定支援
導入
「先月の売上が部門ごとに集計されたダッシュボードを朝イチで確認する」――こうした光景は多くの企業で日常になっています。このような分析環境を支えているのがデータウェアハウスとBIの仕組みです。
くわしく知ろう
データウェアハウス(DWH)とは、分析目的のために社内の複数システムからデータを統合・蓄積する大規模なデータベースのことを指します。W・H・インモン氏が提唱した定義では、主題指向(テーマ別に整理)・統合(複数ソースを一元化)・時系列(時間軸での変化を保持)・非揮発性(更新や削除をせず蓄積する)という4つの特徴を持つとされています。
業務システムが使うOLTP(Online Transaction Processing)は、注文・在庫更新などのリアルタイム処理に特化しています。一方、DWHで使われるOLAP(Online Analytical Processing)は、大量の履歴データを対象に集計・傾向分析を行う処理を指します。この2つは目的が異なるため、多くの組織では別のシステムとして運用されています。
DWHにデータを投入するプロセスをETL(Extract・Transform・Load)と呼びます。各システムからデータを抽出(Extract)し、形式を変換・クレンジング(Transform)してから、DWHに格納(Load)する流れになっています。
データマートとは、DWHから営業部門・経理部門などの特定の用途向けに切り出した、小規模な分析用データベースを指します。部門ごとに必要なデータのみを保持するため、利用者にとって使いやすい構造になっています。BIツールはこうしたデータをダッシュボードやグラフで可視化し、意思決定を支援するソフトウェアの総称です。
具体例
たとえば小売チェーンでは、各店舗のPOSシステムからETLで毎晩データを収集しDWHへ格納します。そこから「東日本営業部向けデータマート」を作成し、BIツールで店別・商品別の売上ダッシュボードとして可視化するという流れが典型的です。
まとめ・試験ポイント
- DWHの4特徴=主題指向・統合・時系列・非揮発性
- OLTP=業務処理(リアルタイム)、OLAP=分析処理(大量の履歴データ)
- ETL=Extract(抽出)→Transform(変換)→Load(格納)の3ステップ
- データマート=DWHから部門別に切り出した分析用データベース
- BIツール=データをダッシュボード・グラフで可視化して意思決定支援
- 試験では「OLTPとOLAPの違い」「ETLの順序」がよく問われる
学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。
入門試験100問に挑戦する