Data SharingとZero Copy — Snowflake・Databricks連携とBYOL
導入
データをコピーして連携するたびにストレージコストが増え、鮮度が失われるという課題を感じたことはないでしょうか。Salesforceの「Zero Copy Partnership」は、データをコピーせずそのまま参照する新しい連携の形を提供します。
くわしく知ろう
Zero Copy Partnership(ゼロコピーパートナーシップ)は、外部のデータプラットフォームとData Cloudがデータを物理的にコピーすることなく、参照・活用できる仕組みです。Salesforceが提携するSnowflakeやDatabricksとの間でこの連携が実現されており、データの所在はパートナーの環境にそのまま置かれた状態でData Cloudから参照・分析・アクティベーションに利用できます。
「Snowflake Data Sharing」との連携では、SnowflakeのデータをData Cloudへコピーすることなく、SnowflakeのDirect Share機能を通じて読み取り専用で参照します。一方、「Databricks Delta Sharing」との連携では、Databricks上のDelta Lake形式のデータをData Cloudから参照する仕組みです。どちらも双方向の連携に対応しており、Data Cloud側のデータをパートナー側から参照することも可能です。
「BYOL(Bring Your Own Lake:外部データレイク持ち込み)」は、企業がすでに保有するAmazon S3やGoogle Cloud Storage、Azure Data Lake Storageといった外部データレイクをData Cloudのデータソースとして活用する方式です。BYOLとZero Copyは混同されやすいですが、BYOLはデータをData Cloud側に取り込む形で連携するのに対し、Zero CopyはData Cloudがコピーなしにパートナー環境のデータを直接参照する点で異なります。データが大規模な場合やすでに別環境で分析基盤が整っている場合に、Zero Copyはとくに有効です。
具体例
たとえばSnowflakeに蓄積された購買トランザクション履歴をData Cloudにコピーせず、Zero Copy連携で直接参照してセグメントを作成し、Marketing Cloud EngagementへActivationするシナリオが実現できます。一方BYOLは、Amazon S3に格納されたログファイルをData StreamでData Cloud側に取り込む形で、物理的なデータ移送を伴う点でZero Copyとは区別されます。
まとめ・試験ポイント
- Zero Copy Partnership=データをコピーせず外部プラットフォームのデータをData Cloudから直接参照する仕組み
- Snowflake Data Sharing=SnowflakeのDirect Share機能でData Cloudが読み取り専用参照する連携
- Databricks Delta Sharing=Databricks上のDelta Lake形式データをData Cloudから参照する連携
- BYOL(Bring Your Own Lake)=外部データレイク(S3等)をData Cloudのデータソースとして取り込む方式
- BYOLとZero Copyの違い=BYOLはData Cloud側へデータを取り込む形、Zero Copyはコピーなしに直接参照する形
- 試験ではZero CopyとBYOLの違い、Snowflake/Databricksとの連携方式が問われやすい
Data Cloudの全体像をさらに深く理解しよう。5層アーキテクチャ・認定資格・導入時の注意点までを体系的に解説した記事を用意しています。
Salesforce Data Cloud 解説記事を読む