データマネジメント基礎
データアーキテクチャ入門 — データ基盤の全体設計
導入
「どのシステムにどのデータがあるのか、誰もわからない」——そんな状況は、企業が成長するにつれてよく起こります。データが散らばった組織では、意思決定に必要な情報を集めるだけで多大な時間がかかってしまいます。
くわしく知ろう
データアーキテクチャとは、組織全体のデータの構造・流れ・統合のあり方を設計した「データ基盤の全体設計図」のことを指します。どのデータがどこで生まれ、どこへ渡り、どのように活用されるかを俯瞰的に定義することで、各システムがばらばらに動くのを防ぎます。
エンタープライズデータモデルは、組織全体で使う主要なデータの種類と関係を1つのモデルとして整理したものです。「顧客」「商品」「注文」といった概念とその関係性を統一的に定義することで、部門をまたいだデータの共通理解が生まれます。
データフロー図は、どのシステムでどのデータが生成・加工・利用されるかを図で表したものです。たとえば「販売システムで受注データが生まれ、在庫システムへ渡り、経営ダッシュボードで集計される」という流れを可視化します。
データ基盤の構成としては、自社内のサーバーで管理するオンプレミス、インターネット上のサービスを利用するクラウド、両者を組み合わせるハイブリッドの3種類があります。また、大量の生データを蓄えるデータレイクや、分析用に整形されたデータを格納するデータウェアハウスも、データアーキテクチャの重要な構成要素として知られています。
具体例
小売業では、店舗のPOSシステムで生まれた販売データが物流システムや会計システムへ流れ、最終的に経営会議用のダッシュボードに集約されます。このデータの流れを設計するのがデータアーキテクチャの役割です。
まとめ・試験ポイント
- データアーキテクチャ=組織全体のデータ構造・流れ・統合の設計図
- エンタープライズデータモデル=全社共通のデータ定義と関係の整理
- データフロー図=データの生成・加工・利用の流れを可視化
- オンプレミス/クラウド/ハイブリッドの3種類の基盤構成
- データレイク=生データの集積場、データウェアハウス=分析用整形済みデータの格納先
- 試験では各用語の役割と違いを問う出題が中心になる
学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。
入門試験100問に挑戦する