データの探索と分析

グループとセット — データをまとめる2つの方法

導入

「東北・北海道の売上を1つにまとめて見たい」「上位10社だけ別の色で強調したい」――こうした場面でTableauのグループとセットが活躍します。どちらもデータをまとめる機能ですが、使い方と動作の仕組みがはっきり異なります。

なぜ重要か

グループとセットはTableau Desktop Specialist試験で「データ整理・分類」領域の頻出トピックとして位置づけられています。どちらもデータをまとめる機能ですが、静的/動的・出力値の形式・再評価の有無という違いを正確に区別できるかが試験で頻繁に問われます。

実務でも地域の再分類・上位N件のハイライト・特定セグメントとそれ以外の比較など、日常的に使われる機能です。グループ=静的な分類、セット=IN/OUTの動的集合という役割の違いを理解していないと、「データ更新で自動反映してほしかったのにグループを使ってしまった」といった設計ミスにつながります。

この単元で両機能の違い・固定セットと動的セット・結合セットを押さえておくと、次の「パラメーター」と合わせて分析表現の幅が一気に広がります。

くわしく知ろう

グループとは、ディメンションの複数のメンバーを1つのカテゴリにまとめる機能を指します。たとえば都道府県ディメンションの「青森」「岩手」「宮城」を「東北」としてまとめるイメージです。グループは静的な分類であり、作成後に元データが変わってもグループの定義は自動では変わりません。作成方法はビュー上で対象のマークを複数選択し、右クリックから「グループ」を選ぶか、データペインのフィールドを右クリックして作成します。グループを作るとデータペインに新しいディメンションフィールドが追加されます。

セットとは、条件または手動で定義したメンバーの集合を指します。セットのフィールドはIN(セットに含まれる)とOUT(含まれない)の2値で表現されます。手動で特定のメンバーを指定する固定セットのほか、「売上上位10社」のような条件を式で指定する動的セットも作成できます。動的セットはデータが更新されると条件に従って自動で再評価される点がグループとの大きな違いです。

さらに2つのセットを組み合わせた結合セットを使うと、「AかつB」「AまたはB」「AにあってBにない」という3種類の集合演算ができます。

具体例で理解する

たとえば「北海道と東北6県」を1つのグループにまとめると、新しいカテゴリとして集計できます。一方、「売上上位5製品」をセットで定義すると、製品ごとにIN/OUTが付与されるため、上位製品だけを色分けして強調するビューを簡単に作れます。

試験での出題パターン

【パターン1:グループ機能の定義を問う問題】

「グループ機能の説明として最も適切なものはどれか」という形式で、「複数のディメンションメンバーをまとめた新しいカテゴリを静的に作成する」を選ばせる問題が頻出します。「IN/OUTの二値で分類」(セットの特徴)、「条件式で自動再評価」(動的セットの特徴)といった誤答と混同しないことが重要です。

【パターン2:動的セットの用途を問う問題】

「売上上位N名を動的に抽出してビューで強調したい場合に最も適切な機能はどれか」という問いで、「動的セットで条件として定義する」を選ばせる問題が出題されます。手動指定の固定セットやグループでは新しいデータに追従できないという点が理解の鍵です。

【パターン3:結合セットの集合演算】

2つのセットを「共通」「いずれか」「差」で組み合わせる結合セットの使い方も応用出題で問われます。ベン図的な集合演算を理解しておくと応用力が付きます。

よくある間違い・紛らわしいポイント

【グループとセットの動作の混同】

×「グループも動的にデータ更新で自動再評価される」→○「グループは静的な分類で更新時に変化しない、動的に再評価されるのはセット(特に動的セット)」。用途が根本的に異なるので、目的に応じて使い分けが必要です。

【固定セットと動的セットの区別を誤解】

×「固定セットは条件式で定義する」→○「固定セットは手動選択、動的セットが条件式(例:上位N件)で定義される」。動的=条件式、固定=手動指定と覚えれば混乱しません。

【セットのIN/OUTの意味を見落とす】

×「セットはメンバーをまとめる機能でグループと同じ出力」→○「セットはIN(セット内)とOUT(セット外)の二値フィールドを生成、色分けや計算式での条件判定に使いやすい」。IN/OUTの二値出力が使い道の広さを生む特徴です。

まとめ・試験ポイント

  • グループ=複数メンバーを1カテゴリにまとめる(静的)、新ディメンションが作成される
  • セット=IN/OUTの二値フィールド、固定セットと動的セットがある
  • 動的セットはデータ更新に伴い自動再評価される
  • 結合セット=2つのセットを「共通」「いずれか」「差」で組み合わせ
  • 試験ではグループとセットの違い(静的/動的、出力値)が頻出

学習した内容を模擬試験で確認しよう。Tableau Desktop基礎(旧Specialist)模擬試験で実力を測ろう。

Tableau Desktop模擬試験に挑戦

実技で試したい方は、Tableau実践演習 初段にも挑戦してみよう。

実践演習 初段を見る