データの探索と分析
散布図で関係を見る — 相関と分布の可視化
導入
「広告費を増やすと本当に売上は伸びるのか?」「気温が上がるほどアイスの売れ行きは良くなるのか?」――2つのデータの間に関係があるかどうかを視覚的に確かめたいとき、散布図が力を発揮します。
くわしく知ろう
散布図は、2つのメジャー(数値)の相関関係や分布を1つのグラフで表現するためのチャートです。Tableauでは、行シェルフに1つ目のメジャー、列シェルフに2つ目のメジャーを配置することで作成できます。それだけでは全データが1点に集約されてしまうため、ディメンションを「詳細」マークカードに配置することで、各データポイントが個別のマークとして分割されて表示されます。
通常、メジャーはSUMやAVGなどの集計が適用されます。個々のデータレコードをそのまま点としてプロットしたい場合は、メジャーの集計をオフにする「集計解除」を使います。これにより、1レコード=1点の散布図が得られます。
グラフ上にトレンドライン(傾向線)を追加するには、分析ペインから「トレンドライン」をビューにドラッグします。右肩上がりの傾向なら正の相関、右肩下がりなら負の相関があることを示します。ディメンションを色のマークカードに置くと、グループ別に色分けされた散布図を作成でき、グループ間の違いを比較するのにも役立ちます。
具体例
たとえば、列に「広告費」・行に「売上」を配置し、「顧客ID」を詳細に置くと、顧客ごとの散布図が描かれます。点の集まり方から広告費と売上の関係性が一目でわかります。
まとめ・試験ポイント
- 散布図=2つのメジャーの相関関係・分布を可視化するグラフ
- 作成手順:列に1つ目のメジャー・行に2つ目のメジャーを配置
- ディメンションを「詳細」に置くとデータポイントが分割される
- 集計解除を使うと1レコード=1点のプロットが可能
- トレンドラインは分析ペインからドラッグして追加する
- 試験では散布図の用途(相関確認)や作成手順が問われやすい
学習した内容を模擬試験で確認しよう。Tableau Desktop Specialist模擬試験で実力を測ろう。
Tableau模擬試験を見る