データ接続と準備

複数データソースの管理 — プライマリとセカンダリの接続

導入

売上データと顧客マスタが別々のシステムにある場合、Tableauでは複数のデータソースを同時に扱う方法が必要になります。接続方法を正しく選ぶことが分析の精度に直結します。

なぜ重要か

複数データソースの扱いはTableau Desktop Specialist試験で頻出のトピックで、結合・関係・データブレンディングの3つの接続方法の違い、プライマリ/セカンダリ、AGG()表示の意味が問われます。多くのBI実務で避けて通れない重要テーマです。

実務でも基幹システムの売上データとBIツールの目標値データを組み合わせる場面、部門ごとに別々のデータベースがある場面など、複数ソースを扱わない分析はほぼありません。3つの接続方法の特性と使い分けを理解できているかで、正しい分析結果を得られるかが決まります。

この単元で結合/関係/ブレンディングの違い・プライマリ/セカンダリ・AGG()の意味を押さえておくと、次の「データ準備」「元データ表示」「試験対策総復習」へと総合的な分析スキルがまとまります。

くわしく知ろう

Tableauでは複数のデータソースを扱う方法として、「結合」「関係」「データブレンディング」の3つがあります。まず結合(Join)は、同じデータソース内の複数テーブルをSQL的に横に合わせる方法で、1つの統合されたデータとして扱います。関係(Relationship)はTableau 2020.2以降の標準的な接続方法で、テーブルを分けたまま柔軟に関連付けます。

データブレンディングは、異なるデータソース同士をビュー上で結びつける方法です。プライマリデータソースとセカンダリデータソースを設定し、共通の「リンクフィールド」を介して集計値をビューに並べます。リンクフィールドはオレンジ色の鎖アイコンで示されます。

プライマリデータソースはビューの粒度を決める主軸となるデータソースを指します。セカンダリデータソースはプライマリに情報を補足するために使われ、そのメジャーには「AGG()」という表示が付くことが特徴です。これはセカンダリのデータが事前集計された状態で結合されることを示しています。

データブレンディングは異なるデータベースやシステムをリアルタイムで組み合わせたいときに有効ですが、行レベルの結合は行えない点に注意が必要です。

具体例で理解する

たとえば、基幹システムの売上データをプライマリに、BIツールで管理する目標値データをセカンダリとして設定すると、「地域」フィールドをリンクとして実績と目標を同じビューに表示できます。

試験での出題パターン

【パターン1:AGG()表示の理由を問う問題】

「セカンダリデータソースのメジャーにAGG()と表示される理由はどれか」という形式で、「セカンダリのデータは事前集計された状態でプライマリに結合されるため」を選ばせる問題が頻出します。「行レベル結合」「AGGという集計関数名」「フィールド名重複ラベル」といった誤答と混同しないことが重要です。

【パターン2:ブレンディングのリンク条件を問う問題】

「プライマリとセカンダリを結びつけるために必要なものはどれか」という問いで、「共通のリンクフィールド」を選ばせる問題が出題されます。「同じデータベース接続」「SQL JOIN定義」「Tableau Prepフロー」などの誤答と区別できることが鍵です。

【パターン3:結合/関係/ブレンディングの使い分け】

同じデータソース内=結合/関係、異なるソース同士=ブレンディングという使い分けや、行レベル結合ができる/できないの違いも応用出題で問われます。

よくある間違い・紛らわしいポイント

【ブレンディングで行レベル結合ができると誤解】

×「ブレンディングも結合と同様に行レベルで組み合わせる」→○「ブレンディングはビュー上での結びつけで事前集計が必要、行レベル結合ができるのは結合(Join)や関係(Relationship)」。用途が根本的に異なる点を押さえましょう。

【プライマリとセカンダリの役割を混同】

×「プライマリとセカンダリは対等な関係」→○「プライマリがビューの粒度を決める主軸、セカンダリは補助情報を提供する従属的な役割」。粒度を決めるのはプライマリのみです。

【結合と関係の違いを知らない】

×「結合と関係は同じ機能」→○「結合はSQL的な行結合で粒度変化のリスクあり、関係はTableau 2020.2以降の柔軟な接続でテーブル独立性を保つ」。関係はDAでも頻出の応用知識です。

まとめ・試験ポイント

  • プライマリデータソース=ビューの粒度を決める主軸
  • セカンダリデータソース=プライマリに情報を補足する追加ソース
  • データブレンディング=異なるソース同士をリンクフィールドで結びつける
  • リンクフィールド=オレンジの鎖アイコンで表示
  • セカンダリのメジャーには「AGG()」が付く(事前集計されるため)
  • 試験では結合・関係・ブレンディングの使い分けが頻出

学習した内容を模擬試験で確認しよう。Tableau Desktop基礎(旧Specialist)模擬試験で実力を測ろう。

Tableau Desktop模擬試験に挑戦

実技で試したい方は、Tableau実践演習 初段にも挑戦してみよう。

実践演習 初段を見る