データマネジメント基礎

Identity Resolution詳細 — マッチルールとReconciliation設計

導入

DC-04でIdentity Resolutionの基本を学びましたが、実際の設計では「どのルールで名寄せするか」「複数ソースで値が違う場合どれを使うか」という細かな判断が品質を左右します。Match RuleとReconciliation Ruleの詳細を理解することで、精度の高いUnified Individualを設計できるようになります。

くわしく知ろう

Identity Resolutionの名寄せは「Identity Resolution Ruleset（IDレゾリューションルールセット）」という設定単位で管理されます。ルールセットの中核となるのが「Match Rule（マッチルール）」で、3種類の照合方式から選択できます。

「Exact Match（完全一致）」は、指定したフィールドの値がまったく同じ場合に同一人物と判定する最も厳格な方式です。メールアドレスや顧客IDのように表記揺れが生じないフィールドに適しています。「Fuzzy Match（ファジーマッチ）」は、完全に一致しなくても文字列の類似度が一定以上の場合に一致とみなす方式です。氏名の略称や中間名の有無など、人間が同一と判断できるが文字列としては異なるケースに有効です。「Normalize（正規化マッチ）」は、比較前にフィールド値を一定のルールで正規化（大文字・小文字の統一、スペース除去、記号除去など）してから照合する方式です。たとえばメールアドレスを小文字に統一してから比較することで、大小文字混在による不一致を防げます。

複数のソースにまたがる同一人物のレコードが特定されたあと、どの値をUnified Individualの正式な属性として採用するかを決めるのが「Reconciliation Rule（照合ルール）」です。設定できるオプションは主に3種類あります。「Most Recent（最新優先）」は最も更新日時が新しいレコードの値を採用します。「Most Frequent（最頻優先）」は複数ソースで最も多く登場する値を採用します。「Source Priority（ソース優先順位）」は管理者があらかじめ設定したソースの優先順位に従って値を選択します。

名寄せの結果として「Unified Individual（統合個人プロファイル）」が生成され、各ソースレコードとUnified Individualとの対応関係は「Individual Unified Link（個人統合リンク）」で管理されます。どのレコードがどのUnified Individualに紐付けられているかを追跡できるため、統合結果の検証や監査が可能です。

具体例

たとえば「tanaka@Example.com」（大文字E）と「tanaka@example.com」（小文字e）が別ソースに存在する場合、Exact Matchのみでは別人と判定されてしまいます。しかしNormalizeマッチを使って両値を小文字に正規化してから比較することで、同一人物として正しく名寄せできます。その後Reconciliationで「Most Recent」を設定すれば、最新ソースのメールアドレスがUnified Individualに採用されます。

まとめ・試験ポイント

Identity Resolution Ruleset＝名寄せルールをまとめて管理する設定単位
Exact Match＝フィールド値が完全一致する場合に同一人物と判定する方式
Fuzzy Match＝文字列の類似度で一致を判定する方式（氏名の表記揺れ等に有効）
Normalize＝比較前に大小文字統一・スペース除去等の正規化を行う照合方式
Reconciliation Rule＝統合後の正式値を決める照合ルール（Most Recent／Most Frequent／Source Priority）
Individual Unified Link＝ソースレコードとUnified Individualの対応関係を管理するオブジェクト
試験ではNormalizeとFuzzy Matchの違い、ReconciliationのMost Recentの意味が問われやすい

Data Cloudの全体像をさらに深く理解しよう。5層アーキテクチャ・認定資格・導入時の注意点までを体系的に解説した記事を用意しています。

Salesforce Data Cloud 解説記事を読む