← DM予想模試(全60問) トップへ
科目B: 事例問題(問49〜60)
問51
ある企業のデータエンジニアチームは、新しいデータパイプラインを設計している。売上データをリアルタイムにDWHに反映し、経営ダッシュボードに表示したい。最も適切なアーキテクチャはどれか。
A日次バッチETLで売上データを全量コピーしてDWHに格納する
BCDC(Change Data Capture)でソースDBの変更をリアルタイムに検出し、ストリーミング処理でDWHに差分反映する
C経営層が必要な時にソースDBに直接SQLクエリを実行して確認する
D売上データをCSVファイルに手動でエクスポートし、毎朝DWHにインポートする
解説
リアルタイムにデータを反映するにはCDCが最適です。ソースDBの変更ログを検出し、Apache KafkaなどのストリーミングプラットフォームでDWHに差分を即時反映します。バッチETLや手動CSVは遅延が発生し、ソースDBへの直接クエリは本番システムに負荷をかけるリスクがあります。