グループとセット — データをまとめる2つの方法
導入
「東北・北海道の売上を1つにまとめて見たい」「上位10社だけ別の色で強調したい」――こうした場面でTableauのグループとセットが活躍します。どちらもデータをまとめる機能ですが、使い方と動作の仕組みがはっきり異なります。
くわしく知ろう
グループとは、ディメンションの複数のメンバーを1つのカテゴリにまとめる機能を指します。たとえば都道府県ディメンションの「青森」「岩手」「宮城」を「東北」としてまとめるイメージです。グループは静的な分類であり、作成後に元データが変わってもグループの定義は自動では変わりません。作成方法はビュー上で対象のマークを複数選択し、右クリックから「グループ」を選ぶか、データペインのフィールドを右クリックして作成します。グループを作るとデータペインに新しいディメンションフィールドが追加されます。
セットとは、条件または手動で定義したメンバーの集合を指します。セットのフィールドはIN(セットに含まれる)とOUT(含まれない)の2値で表現されます。手動で特定のメンバーを指定する固定セットのほか、「売上上位10社」のような条件を式で指定する動的セットも作成できます。動的セットはデータが更新されると条件に従って自動で再評価される点がグループとの大きな違いです。
さらに2つのセットを組み合わせた結合セットを使うと、「AかつB」「AまたはB」「AにあってBにない」という3種類の集合演算ができます。
具体例
たとえば「北海道と東北6県」を1つのグループにまとめると、新しいカテゴリとして集計できます。一方、「売上上位5製品」をセットで定義すると、製品ごとにIN/OUTが付与されるため、上位製品だけを色分けして強調するビューを簡単に作れます。
まとめ・試験ポイント
- グループ=複数メンバーを1カテゴリにまとめる(静的)、新ディメンションが作成される
- セット=IN/OUTの二値フィールド、固定セットと動的セットがある
- 動的セットはデータ更新に伴い自動再評価される
- 結合セット=2つのセットを「共通」「いずれか」「差」で組み合わせ
- 試験ではグループとセットの違い(静的/動的、出力値)が頻出
学習した内容を模擬試験で確認しよう。Tableau Desktop Specialist模擬試験で実力を測ろう。
Tableau模擬試験を見る