データマネジメント基礎

メタデータ管理入門 — データカタログとリネージ

導入

「このファイル、何のデータだっけ?」――社内に膨大なデータがあるのに、どこに何があるかわからない。そんな状況を解消してくれるのがメタデータ管理です。データをより便利に使うための「データの説明書」について確認していきます。

くわしく知ろう

メタデータとは「データについてのデータ」のことです。写真ファイルを例にすると、写真そのものがデータで、撮影日時・場所・カメラ機種などの付帯情報がメタデータにあたります。企業のデータにも同様に、「いつ作られたか」「誰が管理しているか」「どのような意味か」といったメタデータが付与されます。

メタデータはおもに3種類に分類されます。ビジネスメタデータは「顧客ID=お客様を一意に識別する番号」のような、業務上の意味や定義を記述したものです。テクニカルメタデータはデータ型・テーブル名・カラム名など、システム側の技術的な情報を指します。オペレーショナルメタデータはデータの更新日時・処理件数・実行ログなど、運用に関わる情報です。

データカタログは、組織内に存在するデータ資産を一覧化して検索できるようにした仕組みです。図書館の蔵書目録に例えられることが多く、「どんなデータが・どこに・どんな形式で存在するか」を素早く調べることができます。

データリネージ(系譜)は、データがどこから来て、どのような加工を経て現在の姿になったかを追跡する仕組みです。分析結果に疑問が生じたとき、データの出所や変換経路を遡れるため、信頼性の確認に役立ちます。

このほか、用語とその定義を一覧にまとめたデータ辞書も、メタデータ管理の重要な要素として知られています。

具体例

たとえば、マーケティング部門が「売上テーブルの'amt'列は何の金額か」を知りたいとき、データカタログを検索すれば「税込売上金額(円)」と即座に確認できます。一方、ダッシュボードの数値が急変した際にデータリネージを辿ると、上流の集計バッチ処理にミスがあったとわかるといった使い方もできます。

まとめ・試験ポイント

  • メタデータ=データについてのデータ(定義・形式・更新日時など)
  • ビジネスメタデータ=業務上の意味、テクニカルメタデータ=技術的な情報
  • データカタログ=組織内のデータ資産を検索できる仕組み(図書館の目録に相当)
  • データリネージ=データの出所・加工経路を追跡する仕組み
  • データ辞書=用語と定義を一覧化したもの
  • 試験ではデータカタログとデータリネージの定義・役割が問われやすい

学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。

入門試験100問に挑戦する