Tableauの概念理解

集計の仕組み — SUMとAVGが変わる理由

導入

Tableauで棒グラフを作ったとき、ツールチップに「SUM(売上)」と表示されているのを見たことはないでしょうか。これはTableauがメジャーを自動的に集計している証拠です。どのような仕組みで集計されているのかを理解すると、思い通りのグラフが作れるようになります。

なぜ重要か

集計の仕組みは、Tableau Desktop Specialist 試験のデータ操作・計算フィールド・ビュー設計に関わる多くの問題で前提知識として必要です。SUM・AVG・COUNTなどの集計関数の使い分けや、ディメンションを追加したときの集計値の変化は試験で繰り返し問われる頻出テーマです。

実務では、同じ「売上」フィールドでもSUMで合計するのか、AVGで平均するのか、COUNTDで注文件数をカウントするのかによって、まったく異なる意思決定の素材が得られます。集計の基礎を正しく理解することで、ダッシュボード上の数字が何を意味しているかを正確に把握できるようになり、誤った分析を防ぐことができます。

くわしく知ろう

Tableauでは、メジャーをビューに配置すると自動的に集計が適用されます。既定の集計方法はSUM(合計)で、フィールド名が「SUM(売上)」のように表示されます。この集計方法はSUM以外にも、AVG(平均)、COUNT(件数)、MIN(最小値)、MAX(最大値)、MEDIAN(中央値)など複数の種類から選択できます。

ビューの集計結果は、ビューに配置されているディメンションによって決まります。これを「粒度(ビューの詳細レベル)」と呼びます。たとえば「商品カテゴリ」のみがビューにある場合、売上はカテゴリ単位で合計されます。ここに「担当者名」を追加すると、「カテゴリ×担当者」の組み合わせ単位に粒度が細かくなり、それぞれの集計値も変わります。

計算フィールドなどで集計関数を使ったフィールドは、ツールチップやシェルフ上で「AGG(計算名)」と表示されます。これは「すでに集計済みである」ことを示しており、さらに別の集計を重ねられないことを意味しています。

具体例で理解する

たとえば「地域」ディメンションだけがある場合、SUM(売上)は地域ごとの合計になります。そこに「製品」ディメンションを追加すると、「地域×製品」の単位で売上が再集計され、それぞれの棒の高さが変わる様子を確認できます。

試験での出題パターン

【パターン1:集計関数の使い分けを問う問題】

「注文ごとの重複を除いたユニーク件数を求めたい」場合はCOUNTD、「全注文の件数を数えたい」場合はCOUNTというように、目的に合った集計関数を選ぶ問題があります。SUM・AVG・COUNT・COUNTD・MIN・MAXの定義と使いどころを整理しておきましょう。特にCOUNTとCOUNTDの違いは頻出です。

【パターン2:ディメンション追加による集計値変化を問う問題】

「カテゴリのみのビューに担当者名を追加するとSUM(売上)はどう変化するか」という問題では、集計の粒度が細かくなり各マークの値が変わる点が正解です。「合計値が変わらない」という誤答選択肢と区別するために、粒度とビューの関係を正確に理解しておきましょう。

【パターン3:AGG表示の意味を問う問題】

計算フィールドがAGG()と表示されているとき「これはどのような状態か」という問いに対して、「集計済みのため二重集計できない」という点が正解です。SUM(AGG(計算))のような二重集計を試みた際のエラーも合わせて理解しておくと安心です。

よくある間違い・紛らわしいポイント

【COUNTとCOUNTDは別の集計】

COUNTはNULLを除くすべての行数をカウントし、重複も含めます。COUNTDは重複を排除したユニーク値の数を返します。「顧客が何人いるか」を知りたい場合はCOUNTDが適切で、COUNTでは同じ顧客の複数注文を重複カウントしてしまいます。「重複を除いた件数」という文言があればCOUNTDを選びましょう。

【ディメンションに変換した数値は集計されない】

数値フィールドをディメンションに変換すると、SUMやAVGなどの集計が適用されなくなり個別値として扱われます。「なぜ数値が集計されないのか」という疑問が生じたときは、ディメンション/メジャーの設定を確認するのが最初の対処手順です。

【集計と非集計の混在はエラーになる】

計算フィールドで集計済みの値(SUM([売上]))と非集計の値([売上])を混在させるとエラーが発生します。計算フィールドでは「集計か非集計かを統一する」という原則を守る必要があります。

まとめ・試験ポイント

  • メジャーはビューに配置すると自動集計される(既定はSUM)
  • 集計方法はSUM / AVG / COUNT / MIN / MAX / MEDIANなどから選択可能
  • ビューの粒度=配置されているディメンションの組み合わせで決まる
  • ディメンションを追加→粒度が細かくなり集計値も変化する
  • AGG()表示=すでに集計済みで二重集計不可
  • 試験ではディメンション追加による集計値の変化パターンが問われることが多い

学習した内容を模擬試験で確認しよう。Tableau Desktop基礎(旧Specialist)模擬試験で実力を測ろう。

Tableau Desktop模擬試験に挑戦

実技で試したい方は、Tableau実践演習 初段にも挑戦してみよう。

実践演習 初段を見る