データ接続と準備

結合とユニオン — テーブルをつなぐ2つの方法

導入

「先月のデータとまったく同じ構造のファイルが12個ある」「顧客テーブルと購入テーブルをひとつにまとめたい」――こんな場面でTableauが提供する結合とユニオンをうまく使えると、分析の準備がぐっとスムーズになります。

なぜ重要か

結合(Join)とユニオン(Union)は、Tableau Desktop Specialist 試験のデータソース操作の中で最もよく問われるトピックのひとつです。「横につなぐか縦に積むか」という基本的な使い分けだけでなく、Join種別(Inner・Left・Right・Full Outer)の違いやNULL値の扱い、ワイルドカードUnionの仕組みまで幅広く出題されます。

実務では、システムから月別・部門別に分割してエクスポートされたデータを一括で分析したい場面や、顧客マスタと注文履歴のように異なるテーブルを組み合わせたい場面が頻繁に発生します。結合とユニオンを正しく使い分けることで、データ準備の手間を大幅に削減できます。

くわしく知ろう

結合(Join)は、2つのテーブルから共通のキー(IDなど)を手がかりにして、列を横方向に連結する操作です。結合には主に4種類あり、内部結合は両テーブルにマッチする行だけを残し、左結合は左のテーブルの全行にマッチする右テーブルの値を付け加えます(マッチしない部分はNULL)。右結合は右テーブルを基準にする点で左結合の逆であり、完全外部結合は両テーブルのすべての行を残してマッチしない部分をNULLで補います。

一方、ユニオン(Union)はまったく異なるアプローチです。同じ列構造を持つテーブルを縦方向に積み重ね、行を追加していく操作になっています。たとえば1月・2月・3月と別々のファイルに分かれた販売データを一括で積み重ねたいときに使います。結合が「列を増やす」横方向の操作だとすれば、ユニオンは「行を増やす」縦方向の操作として覚えておきましょう。

Tableauのユニオンには便利なワイルドカード機能もあり、命名規則が統一されたファイル群を「sales_2024_*.csv」のようなパターンで指定して、自動的にまとめて読み込むことができます。また、結合を使うとマッチしない行にNULL値が生まれる点は、集計や可視化に影響するため注意が必要です。

具体例で理解する

たとえば、顧客IDをキーにして顧客テーブルと購入テーブルを内部結合すると、両方に存在する顧客の購入履歴のみが取り出せます。一方、月別に作成した12ファイルの売上データをユニオンで縦積みすると、1年分の販売データを一度に分析できるようになります。

試験での出題パターン

【パターン1:結合とユニオンの使い分けを問う問題】

「同じ列構造の月別ファイルをひとつのデータソースにまとめたい場合はどの操作か」という問いにはユニオン、「顧客テーブルと注文テーブルを顧客IDで連結したい場合」には結合が正解です。「横か縦か」「列を増やすか行を増やすか」という切り口を意識すると選択肢を正確に絞れます。

【パターン2:Join種別を問う問題】

「購入履歴がない顧客も含めて全顧客を表示したい」場合は左結合(顧客テーブルを左に配置)、「両方のテーブルに存在するデータだけを使いたい」場合は内部結合が正解です。各種別の「残る行」と「NULLになる箇所」をセットで整理しておきましょう。

【パターン3:ワイルドカードUnionを問う問題】

「命名規則が統一されたCSVファイルを自動的にまとめて読み込む機能はどれか」という問いには「ワイルドカードUnion」が正解です。ファイル名にパターンを指定して複数ファイルをまとめて取り込める点がポイントで、結合やLOD計算と混同しないよう区別して覚えておいてください。

よくある間違い・紛らわしいポイント

【内部結合と左結合の「残る行」の違い】

内部結合は両テーブルに共通するキーが存在する行だけを残します。左結合は左テーブルのすべての行を残し、右テーブルにマッチする値がなければNULLを補完します。「購入履歴がない顧客を含めたい」という場面で内部結合を選ぶと、その顧客が結果から消えてしまいます。

【ユニオンは列構造が一致していないと使えない】

ユニオンは積み重ねるテーブルの列名・データ型が一致していることが前提です。列名が異なる場合はTableauが自動的にNULLを補完しますが、意図しないデータ欠損が生じます。試験でも「ユニオンを使うための前提条件」として問われることがあります。

【結合でデータ型の不一致があるとNULLが増える】

Joinキーのデータ型(文字列と数値など)が一致していない場合、マッチが正しく行われずNULLが大量に発生します。結合後に予想より行数が少ない・NULLが多い場合は、キーのデータ型を確認するのが最初の対処手順です。

まとめ・試験ポイント

  • 結合(Join)=共通キーで列を横に連結、マッチしない行はNULL
  • ユニオン(Union)=同構造テーブルを縦に積み重ね、行を追加
  • 内部結合=共通行のみ、左結合=左テーブル全行を基準、完全外部結合=全行を残す
  • ユニオンのワイルドカード=命名規則が統一されたファイルを自動検索
  • 試験では「結合とユニオンの違い(横か縦か)」が問われやすい

学習した内容を模擬試験で確認しよう。Tableau Desktop基礎(旧Specialist)模擬試験で実力を測ろう。

Tableau Desktop模擬試験に挑戦

実技で試したい方は、Tableau実践演習 初段にも挑戦してみよう。

実践演習 初段を見る