データの探索と分析(DA)

LOD計算の実践パターン — 顧客単価・コホート分析への応用

導入

LOD計算は「難しい計算式」というイメージを持たれがちですが、実は「顧客ひとりあたりの購入額を知りたい」「初回購入月で顧客を分類したい」といった、よく聞く分析ニーズにぴったり対応しています。典型的なパターンを知ると、LOD計算を自分で組み立てるときの道筋が見えてきます。

なぜ重要か

DA試験において、LOD計算の活用パターンは「FIXED・INCLUDE・EXCLUDEの定義を知っている」だけでなく「どの分析ニーズにどのパターンを使うか判断できる」能力まで問われます。「データの探索と分析」ドメインの中でも実践的な応用問題として出題されるため、具体的な計算パターンを複数身につけておくことが得点に直結します。

実務でも顧客単価の算出やコホート分析はデータアナリストが日常的に取り組む課題です。特にコホート分析はリテンション率の可視化に欠かせない手法として多くの企業で活用されており、FIXEDによる初回購入日の固定はその入口となる定番パターンになっています。

この単元でパターンを体系的に整理しておくと、試験の応用問題で「この場面ではどのLOD計算を使うか」を素早く判断できるようになります。前の単元で学んだFIXED・INCLUDE・EXCLUDEの知識をここで実践的に結びつけることが目的です。

くわしく知ろう

LOD計算の代表的な実践パターンとして、まず「顧客単価(顧客ひとりあたりの平均売上)」を求める計算があります。ビューのディメンションが「カテゴリ」や「地域」になっているとき、単純にAVG([売上])を計算してもトランザクション単位の平均になってしまいます。そこで `{ INCLUDE [顧客ID] : SUM([売上]) }` で顧客ごとの合計をいったん計算してからAVGをかけることで、正しい顧客単価が得られます。

次によく使われるのがコホート分析への応用です。コホート分析とは、ユーザーを「初回購入月」や「登録月」といった共通の属性でグループ分けし、その後の行動変化を追う手法を指します。Tableauでは `{ FIXED [顧客ID] : MIN([注文日]) }` のようにFIXEDを使って「顧客ごとの最初の注文日」を計算し、そこから月を抽出してコホートグループを作るパターンが知られています。

また、「全体売上に占める割合」を求める場面ではEXCLUDEが活躍します。ビューに「地域」が置かれているとき、`{ EXCLUDE [地域] : SUM([売上]) }` で全地域合計を取り出し、各地域の売上を割り算すれば構成比が得られます。

これらのパターンに共通するのは「ビューの詳細レベルとは異なる粒度の値を同時に扱いたい」というニーズです。LOD計算はそのために設計された仕組みになっています。

具体例で理解する

たとえばECサイトの分析で「2024年1月に初めて購入した顧客グループが、その後6か月間で何回リピートしたか」を追うのがコホート分析の典型例です。FIXEDで各顧客の初回購入月を固定してグループ化し、月次のリピート率を折れ線グラフで並べて比較します。

試験での出題パターン

【パターン1:分析ニーズとLOD計算の対応を問う問題】

「顧客ごとの初回購入日を求めてコホートグループを作りたい。最も適切なLOD計算式はどれか」という形式で、FIXED・INCLUDE・EXCLUDEの選択と構文の正確さが問われます。選択肢には `{ FIXED [顧客ID] : MIN([注文日]) }` と `{ INCLUDE [顧客ID] : MIN([注文日]) }` が並ぶことが多く、コホートの基準値としてビューの影響を受けない安定した値が必要という点からFIXEDが正解になります。

【パターン2:顧客単価の計算手順を問う問題】

「カテゴリ別の顧客ひとりあたり平均売上を求めるための手順として正しいものはどれか」という応用問題が出ます。単純にAVG([売上])を使った選択肢と、INCLUDEで顧客単位の合計を先に求めてからAVGで集計する選択肢が並び、2段階の集計処理の理解が必要です。また「分母として全体合計を取り出す場面でEXCLUDEを使う」というパターンも問われます。どのキーワードをどの目的で使うかという実践的な判断力が試されます。

よくある間違い・紛らわしいポイント

【顧客単価にAVG([売上])をそのまま使ってしまう誤り】

AVG([売上])はトランザクションごとの平均売上であり、1人の顧客が複数回購入している場合は顧客単価になりません。正しくは `{ INCLUDE [顧客ID] : SUM([売上]) }` で顧客合計を先に求めてからAVGで集計する2段階処理が必要です。

【コホート分析でINCLUDEを使ってしまう誤り】

コホートの基準値はビューの構成が変わっても同じ値を返す必要があります。INCLUDEはビューのディメンションに依存するため結果が変わる可能性があり、FIXEDを使うことで顧客ごとの最初の注文日を安定して固定できます。

【EXCLUDEの構成比計算でFIXEDを選んでしまう誤り】

ビューに地域が置かれていて「地域を除いた合計」が必要な場面はEXCLUDEが適切です。FIXEDのディメンション空欄はビューと無関係にデータ全体の集計を返す点で動作が異なります。

まとめ・試験ポイント

  • 顧客単価=INCLUDE [顧客ID] : SUM([売上]) をAVGで集計するパターン
  • コホート分析=FIXED [顧客ID] : MIN([注文日]) で初回購入日を顧客ごとに固定
  • 構成比計算=EXCLUDEで上位集計値を取り出して分母に使う
  • LOD計算の共通目的=ビューの粒度と異なる集計値を同時に扱うこと
  • 試験では「この分析に使うLOD計算のキーワードはどれか」という形で出題される

学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。

Tableau DA模擬試験に挑戦