複数データソースの管理 — プライマリとセカンダリの接続
導入
売上データと顧客マスタが別々のシステムにある場合、Tableauでは複数のデータソースを同時に扱う方法が必要になります。接続方法を正しく選ぶことが分析の精度に直結します。
くわしく知ろう
Tableauでは複数のデータソースを扱う方法として、「結合」「関係」「データブレンディング」の3つがあります。まず結合(Join)は、同じデータソース内の複数テーブルをSQL的に横に合わせる方法で、1つの統合されたデータとして扱います。関係(Relationship)はTableau 2020.2以降の標準的な接続方法で、テーブルを分けたまま柔軟に関連付けます。
データブレンディングは、異なるデータソース同士をビュー上で結びつける方法です。プライマリデータソースとセカンダリデータソースを設定し、共通の「リンクフィールド」を介して集計値をビューに並べます。リンクフィールドはオレンジ色の鎖アイコンで示されます。
プライマリデータソースはビューの粒度を決める主軸となるデータソースを指します。セカンダリデータソースはプライマリに情報を補足するために使われ、そのメジャーには「AGG()」という表示が付くことが特徴です。これはセカンダリのデータが事前集計された状態で結合されることを示しています。
データブレンディングは異なるデータベースやシステムをリアルタイムで組み合わせたいときに有効ですが、行レベルの結合は行えない点に注意が必要です。
具体例
たとえば、基幹システムの売上データをプライマリに、BIツールで管理する目標値データをセカンダリとして設定すると、「地域」フィールドをリンクとして実績と目標を同じビューに表示できます。
まとめ・試験ポイント
- プライマリデータソース=ビューの粒度を決める主軸
- セカンダリデータソース=プライマリに情報を補足する追加ソース
- データブレンディング=異なるソース同士をリンクフィールドで結びつける
- リンクフィールド=オレンジの鎖アイコンで表示
- セカンダリのメジャーには「AGG()」が付く(事前集計されるため)
- 試験では結合・関係・ブレンディングの使い分けが頻出
学習した内容を模擬試験で確認しよう。Tableau Desktop Specialist模擬試験で実力を測ろう。
Tableau模擬試験を見る