クラスター分析 — データをグループに自動分類する
導入
お客さまを「よく買う人」「たまに買う人」「価格に敏感な人」と分けて施策を変えたいとき、手作業で分類するのは大変です。Tableauのクラスター分析を使えば、データが自動でグループに分かれ、顧客像を視覚的につかめるようになります。
くわしく知ろう
クラスター分析とは、似た特徴を持つデータ点を自動でグループ(クラスター)にまとめる分析手法のことです。Tableauではビュー上の散布図などに対して数クリックで適用できます。
Tableauが採用しているアルゴリズムはKクラスタリング(k-means法)です。Kクラスタリングとは、分析者がクラスター数(K)をあらかじめ指定し、各データ点を最も近いクラスターの中心(重心)に割り当てることを繰り返して収束させる手法を指します。クラスター数Kの指定が分析結果に大きく影響するため、ビジネス上の目的に合わせた設定が重要です。
Tableauでは、分析ペインから「クラスター」をビューにドラッグするだけでクラスタリングが実行されます。クラスター数は自動で推薦されますが、手動でKを変更して結果を比較することもできます。また、クラスターを計算に含めるディメンションやメジャーを追加・削除して、分類の基準を細かく調整できます。
作成したクラスターはディメンションとして保存でき、フィルターやカラーに活用できます。ただし、クラスタリングはデータの特徴を探索するための手法であり、結果の解釈には分析者のドメイン知識が不可欠です。機械が自動でグループを作るとはいえ、「このグループが何を意味するか」を判断するのは人間の役割になっています。
具体例
たとえば顧客データを「購入頻度」と「客単価」の2軸で散布図に表示してKクラスタリングを適用すると、ヘビーユーザー層・ライトユーザー層・高単価少頻度層などのグループが自動で分かれます。各グループにカラーが付与され、違いが一目で視覚化されます。
まとめ・試験ポイント
- クラスター分析=似た特徴を持つデータを自動でグループ化する手法
- TableauのアルゴリズムはKクラスタリング(k-means法)
- Kの指定が必要=クラスター数は分析者が設定(自動推薦もあり)
- Kが変わると結果も変わる=ビジネス目的に合わせて調整
- 作成したクラスターはディメンションとして保存・活用可能
- 試験では「Kクラスタリングの仕組み」や「クラスター数の意味」が問われやすい
学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。
Tableau DA模擬試験を見る