データの探索と分析(DA)

INCLUDEとEXCLUDE — 粒度を広げる・狭める使い分け

導入

FIXEDで粒度を固定する方法は学んだけれど、「ビューの詳細レベルを少しだけ変えたい」というケースではINCLUDEとEXCLUDEが活躍します。この2つは名前が対になっているだけに混同されやすいのですが、考え方を整理するととても便利な道具として使えるようになります。

なぜ重要か

DA試験において、INCLUDEとEXCLUDEはFIXEDとセットで出題される重要トピックです。「データの探索と分析」ドメインでは3種類のLOD計算を正確に区別して使い分ける能力が問われており、中でもINCLUDEとEXCLUDEはフィルター処理順序の単元とも深く関連します。

実務での活用場面も豊富で、INCLUDEは顧客単価の正確な算出や粒度を細かくした集計が必要な場面で頻繁に登場します。EXCLUDEは構成比の分母を取り出すときや、上位グループの合計と各行を比較したいときに使われます。ビューの構成を変えずに集計粒度だけを調整できる点が、ダッシュボード設計において大きな利点となっています。

FIXEDとの違いを理解したうえでINCLUDE・EXCLUDEを習得することで、LOD計算の全体像が把握でき、次の「LOD計算の活用パターン」や「フィルター処理順序」の学習がより明確に理解できるようになります。

くわしく知ろう

LOD計算(詳細レベル式)には FIXED・INCLUDE・EXCLUDE の3種類がありますが、INCLUDEとEXCLUDEはビューに配置されているディメンションを基準に動作する点がFIXEDと大きく異なります。

INCLUDE は「ビューのディメンションに加えて、さらに指定したディメンションも集計に含める」計算式です。たとえばビューに「カテゴリ」だけが置かれているとき、`{ INCLUDE [顧客ID] : SUM([売上]) }` と書くと、カテゴリごとではなく「カテゴリ×顧客ID」という細かい粒度で集計した結果をビューに持ち込めます。これにより、顧客ひとりひとりの売上を計算してからカテゴリ単位で平均するような、粒度を細かくしたい場面で力を発揮します。

EXCLUDE は逆に「ビューのディメンションの中から、指定したディメンションを集計対象から除く」計算式です。たとえばビューに「地域」と「カテゴリ」が置かれているとき、`{ EXCLUDE [地域] : SUM([売上]) }` と書くと、地域を無視してカテゴリ全体の合計が返ってきます。個々の行に対して「全体や上位集計値と比較したい」場面で活用されます。

また、FIXEDはビューのディメンションに影響されず常に指定した粒度で計算されますが、INCLUDEとEXCLUDEはビューのディメンションを起点にしているため、ビューに配置されているフィールドが変わると結果も変わることを覚えておきましょう。

具体例で理解する

たとえば「カテゴリ別の平均顧客購入額」を求めるとき、INCLUDEを使って顧客単位の売上を先に計算してからAVGで集計することで、顧客ごとの購入額平均が得られます。一方EXCLUDEは、地域別ビューで「各地域の売上が全国合計に占める割合」を求めるときに、分母として全国合計を取り出す用途に向いています。

試験での出題パターン

【パターン1:3種類のLOD計算の使い分けを問う問題】

「ビューにカテゴリだけが置かれた状態で顧客ごとの売上を計算に加えたい。最適なキーワードはどれか」という形式が典型的です。選択肢にFIXED・INCLUDE・EXCLUDE・WINDOW_AVGが並ぶことが多く、「ビューに依存するかしないか」「粒度を細かくするか粗くするか」という軸で判断する問題です。INCLUDEはビュー依存かつ粒度を細かくする、EXCLUDEはビュー依存かつ粒度を粗くする、という方向性を覚えることが鍵です。

【パターン2:EXCLUDEの計算結果を問う問題】

「ビューに地域とカテゴリが置かれているとき、`{ EXCLUDE [地域] : SUM([売上]) }` の結果として正しいものはどれか」という動作確認問題が出ます。「地域を無視してカテゴリ全体の合計を返す」が正解ですが、「カテゴリを無視した地域合計」と混同させる選択肢が並ぶため、EXCLUDEが「指定したものを除く」という名前通りの動作をする点を意識して覚えておきましょう。Desktop Specialistとの違いとして、DA試験ではビューの構成を前提とした動作まで問われます。

よくある間違い・紛らわしいポイント

【INCLUDEとFIXEDの混同】

どちらもある粒度で集計した値を返しますが、FIXEDはビューの影響を受けず常に指定した粒度で固定されます。INCLUDEはビューのディメンションを維持したまま指定ディメンションを追加するため、ビューに置かれたフィールドが変わると結果も変わります。「ビューに何を置いているかで結果が変わるかどうか」がFIXEDとINCLUDEを区別するポイントです。

【EXCLUDEの対象ディメンションの誤解】

`{ EXCLUDE [地域] : SUM([売上]) }` を見て「地域のデータだけの合計が返る」と誤解するケースがあります。EXCLUDEは指定したディメンションを集計から「除外」するため、地域の区別を取り除いたカテゴリ全体の合計が返ります。「地域を無視する(除く)」という動作が正しい理解です。

【INCLUDEとEXCLUDEの方向感の混乱】

INCLUDEは粒度を「細かくする(ビューより詳細なレベルで集計する)」、EXCLUDEは粒度を「粗くする(ビューより大まかなレベルで集計する)」と整理すると混乱しにくくなります。名前のINCLUDE=追加する、EXCLUDE=除く、という語義と方向感を対応させて覚えましょう。

まとめ・試験ポイント

  • INCLUDE=ビューのディメンションにさらに指定ディメンションを追加して細かく集計
  • EXCLUDE=ビューのディメンションから指定ディメンションを除いて粗く集計
  • FIXEDはビューに依存しないが、INCLUDEとEXCLUDEはビューのディメンション構成に依存する
  • INCLUDEは粒度を「狭める(細かくする)」、EXCLUDEは粒度を「広げる(粗くする)」
  • 試験では3種類の違いと、どの場面でどれを使うかを問う問題が頻出

学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。

Tableau DA模擬試験に挑戦