データ接続と準備

複数データソースの管理 — プライマリとセカンダリの接続

導入

売上データと顧客マスタが別々のシステムにある場合、Tableauでは複数のデータソースを同時に扱う方法が必要になります。接続方法を正しく選ぶことが分析の精度に直結します。

くわしく知ろう

Tableauでは複数のデータソースを扱う方法として、「結合」「関係」「データブレンディング」の3つがあります。まず結合(Join)は、同じデータソース内の複数テーブルをSQL的に横に合わせる方法で、1つの統合されたデータとして扱います。関係(Relationship)はTableau 2020.2以降の標準的な接続方法で、テーブルを分けたまま柔軟に関連付けます。

データブレンディングは、異なるデータソース同士をビュー上で結びつける方法です。プライマリデータソースとセカンダリデータソースを設定し、共通の「リンクフィールド」を介して集計値をビューに並べます。リンクフィールドはオレンジ色の鎖アイコンで示されます。

プライマリデータソースはビューの粒度を決める主軸となるデータソースを指します。セカンダリデータソースはプライマリに情報を補足するために使われ、そのメジャーには「AGG()」という表示が付くことが特徴です。これはセカンダリのデータが事前集計された状態で結合されることを示しています。

データブレンディングは異なるデータベースやシステムをリアルタイムで組み合わせたいときに有効ですが、行レベルの結合は行えない点に注意が必要です。

具体例

たとえば、基幹システムの売上データをプライマリに、BIツールで管理する目標値データをセカンダリとして設定すると、「地域」フィールドをリンクとして実績と目標を同じビューに表示できます。

まとめ・試験ポイント

  • プライマリデータソース=ビューの粒度を決める主軸
  • セカンダリデータソース=プライマリに情報を補足する追加ソース
  • データブレンディング=異なるソース同士をリンクフィールドで結びつける
  • リンクフィールド=オレンジの鎖アイコンで表示
  • セカンダリのメジャーには「AGG()」が付く(事前集計されるため)
  • 試験では結合・関係・ブレンディングの使い分けが頻出

学習した内容を模擬試験で確認しよう。Tableau Desktop Specialist模擬試験で実力を測ろう。

Tableau模擬試験を見る