データマネジメント基礎

データ取り込みとハーモナイゼーション — DLOとDMOの違い

導入

データをData Cloudに取り込んだあと、そのまま使えるわけではありません。「DLO」と「DMO」という2つの概念を理解すると、なぜ変換が必要なのかがすっきりとわかるようになります。

くわしく知ろう

Data Cloudへのデータ取り込みは「Data Streams(データストリーム)」という仕組みを通じて行われます。Data Streamsには、Salesforceの各クラウドとリアルタイムで連携するコネクタ型、CSVなどのファイルをアップロードするバッチ型、Amazon S3やGoogle Cloud Storageなどのクラウドストレージと連携する型など、複数の接続方式が用意されています。

Data Streamから取り込まれたデータは、まず「DLO(Data Lake Object:データレイクオブジェクト)」として格納されます。DLOは取り込んだデータをそのままの形で保持するオブジェクトです。ソースシステムのスキーマや命名規則がそのまま反映されるため、システムごとに構造が異なります。

このDLOを、Salesforceが定めた標準データモデルに合わせて変換・マッピングしたものが「DMO(Data Model Object:データモデルオブジェクト)」です。たとえばSalesforceが標準的に定義するUnified IndividualやContact PointといったDMOにDLOのフィールドをマッピングすることで、異なるソース間でデータの意味が統一されます。この変換処理全体を「ハーモナイゼーション」と呼び、Data CloudのHarmonizeレイヤーが担います。DLO→DMOの変換が適切に行われることで、後続のIdentityResolutionやSegmentation処理が正確に機能するようになります。

具体例

たとえばECシステムから取り込んだDLOには「user_email」というフィールドがあり、CRMから取り込んだDLOには「Email__c」という別名のフィールドがあるとします。ハーモナイゼーションでそれぞれをDMOの「Email」フィールドにマッピングすることで、2つのソースの顧客メールアドレスが同一の意味として扱えるようになります。

まとめ・試験ポイント

  • Data Streams=外部ソースからData Cloudへデータを取り込む接続の仕組み
  • DLO(Data Lake Object)=ソースデータをそのままの形で格納するオブジェクト
  • DMO(Data Model Object)=標準データモデルに合わせて変換・マッピングしたオブジェクト
  • ハーモナイゼーション=DLO→DMOへの変換処理で、異なるソース間の意味を統一する
  • DMOへの変換が正確なほど、後続の名寄せ・セグメント処理の精度が高まる
  • 試験ではDLOとDMOの役割の違い、ハーモナイゼーションの目的が問われやすい

Data Cloudの全体像をさらに深く理解しよう。5層アーキテクチャ・認定資格・導入時の注意点までを体系的に解説した記事を用意しています。

Salesforce Data Cloud 解説記事を読む