← プロデジ(データ・AI)想定問題集 トップへ
科目A: データエンジニアリング(問29〜35)
問29
データウェアハウス(DWH)、データレイク(DL)、データマート(DM)の関係として最も適切なものはどれか。
Aデータマートは全社統合データの集合体であり、DWHは部門別サブセットである
BデータレイクとDWHは同一概念で、名前が違うだけである
Cデータレイクは生データを蓄積、DWHはクレンジング・統合したデータを格納、データマートは用途・部門別に最適化したデータの集合である
Dデータマートを最初に構築し、そこから逆にDWHとデータレイクを派生させる
解説
データレイクは構造化・非構造化を問わず生データを蓄積、DWHはクレンジングと統合を経た組織横断の分析用データを格納、データマートは特定部門や特定用途に最適化したDWHのサブセットを格納します。一般的なデータの流れはDL→DWH→DMの順です。