データの探索と分析
ビンとヒストグラム — 分布を可視化する
導入
テストの点数や商品の価格帯など、数値がどのように分布しているかを一目でつかみたい場面はよくありますね。Tableauの「ビン」と「ヒストグラム」を使うと、連続する数値を区切って分布を視覚化できます。
くわしく知ろう
ビン(Bin)とは、連続する数値を一定の幅で区切ってグループ化したものを指します。たとえば0〜9、10〜19、20〜29というように、連続値をいくつかの「箱」に分類する仕組みです。
ビンの作成方法は、データペイン上のメジャーを右クリックして「作成」→「ビン」を選びます。表示されるダイアログでビンのサイズ(幅)を指定できます。このサイズの設定が分布の見え方を大きく左右するため、データの範囲や目的に応じて適切な値を選ぶことが重要です。
ヒストグラムとは、ビンを横軸に、そのビンに含まれる件数(COUNT)を縦軸の棒で表した分布図を指します。山の形が左右対称に近ければ正規分布、一方に偏っていれば偏りのある分布と判断できます。外れ値の存在も視覚的に確認しやすく、データの全体像を把握するのに有効です。
「表示形式」パネルから「ヒストグラム」を選ぶと、ビンの作成から棒グラフの配置まで自動で行われるため、素早く分布を確認したいときに便利です。
具体例
たとえば顧客の年齢フィールドに対してビンサイズ10を設定すると、10代・20代・30代というグループが自動で作成されます。これを棒グラフで表示すれば、どの年代層が最も多いかを一目で把握できるヒストグラムになります。
まとめ・試験ポイント
- ビン=連続する数値を一定の幅で区切ってグループ化したもの
- ビンの作成=メジャーを右クリック →「作成」→「ビン」
- ビンのサイズ設定が分布の見え方を左右する
- ヒストグラム=ビンを軸に件数(COUNT)を棒で表した分布図
- 「表示形式」から「ヒストグラム」を選ぶと自動作成できる
- 分布の形(正規・偏り・外れ値)の読み取りが問われることがある
学習した内容を模擬試験で確認しよう。Tableau Desktop Specialist模擬試験で実力を測ろう。
Tableau模擬試験を見る