データ取り込みとハーモナイゼーション — DLOとDMOの違い
導入
データをData Cloudに取り込んだあと、そのまま使えるわけではありません。「DLO」と「DMO」という2つの概念を理解すると、なぜ変換が必要なのかがすっきりとわかるようになります。
くわしく知ろう
Data Cloudへのデータ取り込みは「Data Streams(データストリーム)」という仕組みを通じて行われます。Data Streamsには、Salesforceの各クラウドとリアルタイムで連携するコネクタ型、CSVなどのファイルをアップロードするバッチ型、Amazon S3やGoogle Cloud Storageなどのクラウドストレージと連携する型など、複数の接続方式が用意されています。
Data Streamから取り込まれたデータは、まず「DLO(Data Lake Object:データレイクオブジェクト)」として格納されます。DLOは取り込んだデータをそのままの形で保持するオブジェクトです。ソースシステムのスキーマや命名規則がそのまま反映されるため、システムごとに構造が異なります。
このDLOを、Salesforceが定めた標準データモデルに合わせて変換・マッピングしたものが「DMO(Data Model Object:データモデルオブジェクト)」です。たとえばSalesforceが標準的に定義するUnified IndividualやContact PointといったDMOにDLOのフィールドをマッピングすることで、異なるソース間でデータの意味が統一されます。この変換処理全体を「ハーモナイゼーション」と呼び、Data CloudのHarmonizeレイヤーが担います。DLO→DMOの変換が適切に行われることで、後続のIdentityResolutionやSegmentation処理が正確に機能するようになります。
具体例
たとえばECシステムから取り込んだDLOには「user_email」というフィールドがあり、CRMから取り込んだDLOには「Email__c」という別名のフィールドがあるとします。ハーモナイゼーションでそれぞれをDMOの「Email」フィールドにマッピングすることで、2つのソースの顧客メールアドレスが同一の意味として扱えるようになります。
まとめ・試験ポイント
- Data Streams=外部ソースからData Cloudへデータを取り込む接続の仕組み
- DLO(Data Lake Object)=ソースデータをそのままの形で格納するオブジェクト
- DMO(Data Model Object)=標準データモデルに合わせて変換・マッピングしたオブジェクト
- ハーモナイゼーション=DLO→DMOへの変換処理で、異なるソース間の意味を統一する
- DMOへの変換が正確なほど、後続の名寄せ・セグメント処理の精度が高まる
- 試験ではDLOとDMOの役割の違い、ハーモナイゼーションの目的が問われやすい
Data Cloudの全体像をさらに深く理解しよう。5層アーキテクチャ・認定資格・導入時の注意点までを体系的に解説した記事を用意しています。
Salesforce Data Cloud 解説記事を読む