データの探索と分析(DA)

クラスター分析 — データをグループに自動分類する

導入

お客さまを「よく買う人」「たまに買う人」「価格に敏感な人」と分けて施策を変えたいとき、手作業で分類するのは大変です。Tableauのクラスター分析を使えば、データが自動でグループに分かれ、顧客像を視覚的につかめるようになります。

くわしく知ろう

クラスター分析とは、似た特徴を持つデータ点を自動でグループ(クラスター)にまとめる分析手法のことです。Tableauではビュー上の散布図などに対して数クリックで適用できます。

Tableauが採用しているアルゴリズムはKクラスタリング(k-means法)です。Kクラスタリングとは、分析者がクラスター数(K)をあらかじめ指定し、各データ点を最も近いクラスターの中心(重心)に割り当てることを繰り返して収束させる手法を指します。クラスター数Kの指定が分析結果に大きく影響するため、ビジネス上の目的に合わせた設定が重要です。

Tableauでは、分析ペインから「クラスター」をビューにドラッグするだけでクラスタリングが実行されます。クラスター数は自動で推薦されますが、手動でKを変更して結果を比較することもできます。また、クラスターを計算に含めるディメンションやメジャーを追加・削除して、分類の基準を細かく調整できます。

作成したクラスターはディメンションとして保存でき、フィルターやカラーに活用できます。ただし、クラスタリングはデータの特徴を探索するための手法であり、結果の解釈には分析者のドメイン知識が不可欠です。機械が自動でグループを作るとはいえ、「このグループが何を意味するか」を判断するのは人間の役割になっています。

具体例

たとえば顧客データを「購入頻度」と「客単価」の2軸で散布図に表示してKクラスタリングを適用すると、ヘビーユーザー層・ライトユーザー層・高単価少頻度層などのグループが自動で分かれます。各グループにカラーが付与され、違いが一目で視覚化されます。

まとめ・試験ポイント

  • クラスター分析=似た特徴を持つデータを自動でグループ化する手法
  • TableauのアルゴリズムはKクラスタリング(k-means法)
  • Kの指定が必要=クラスター数は分析者が設定(自動推薦もあり)
  • Kが変わると結果も変わる=ビジネス目的に合わせて調整
  • 作成したクラスターはディメンションとして保存・活用可能
  • 試験では「Kクラスタリングの仕組み」や「クラスター数の意味」が問われやすい

学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。

Tableau DA模擬試験を見る