データの探索と分析

ビンとヒストグラム — 分布を可視化する

導入

テストの点数や商品の価格帯など、数値がどのように分布しているかを一目でつかみたい場面はよくありますね。Tableauの「ビン」と「ヒストグラム」を使うと、連続する数値を区切って分布を視覚化できます。

なぜ重要か

ビンとヒストグラムはTableau Desktop Specialist試験の「ビジュアライゼーション」領域で出題される重要トピックで、データ分布を可視化する基礎技術として位置づけられています。連続値を一定幅で区切るという考え方は、統計リテラシーの基礎としても重要です。

実務でも顧客年齢層の分析・商品価格帯の構成・テストスコア分布・所得階層の把握など、幅広く活用される技法です。分布の形(正規分布・偏り・外れ値の有無)を瞬時に読み取れるかで、データの全体像把握の速度が変わります。適切なビンサイズ選択が分析結果の見え方を左右するため、目的に応じたサイズ設定の感覚も重要なスキルです。

この単元でビンの作成手順・ヒストグラムの構造・ビンサイズの影響を押さえておくと、Tableau Desktop Specialist試験の分布関連問題で失点しなくなります。

くわしく知ろう

ビン(Bin)とは、連続する数値を一定の幅で区切ってグループ化したものを指します。たとえば0〜9、10〜19、20〜29というように、連続値をいくつかの「箱」に分類する仕組みです。

ビンの作成方法は、データペイン上のメジャーを右クリックして「作成」→「ビン」を選びます。表示されるダイアログでビンのサイズ(幅)を指定できます。このサイズの設定が分布の見え方を大きく左右するため、データの範囲や目的に応じて適切な値を選ぶことが重要です。

ヒストグラムとは、ビンを横軸に、そのビンに含まれる件数(COUNT)を縦軸の棒で表した分布図を指します。山の形が左右対称に近ければ正規分布、一方に偏っていれば偏りのある分布と判断できます。外れ値の存在も視覚的に確認しやすく、データの全体像を把握するのに有効です。

「表示形式」パネルから「ヒストグラム」を選ぶと、ビンの作成から棒グラフの配置まで自動で行われるため、素早く分布を確認したいときに便利です。

具体例で理解する

たとえば顧客の年齢フィールドに対してビンサイズ10を設定すると、10代・20代・30代というグループが自動で作成されます。これを棒グラフで表示すれば、どの年代層が最も多いかを一目で把握できるヒストグラムになります。

試験での出題パターン

【パターン1:ビンの作成手順を問う問題】

「ビンを作成する操作として正しいものはどれか」という形式で、「メジャーを右クリックして『作成』→『ビン』を選ぶ」を選ばせる問題が頻出します。「ディメンションを右クリック」「分析メニューからビン追加」「フィルターシェルフからビンタブ」などの誤った操作を並べる紛らわしい選択肢があるため、メジャーに対して作成するという原則を押さえておきましょう。

【パターン2:ヒストグラムの構造を問う問題】

「ヒストグラムの特徴として最も適切なものはどれか」という問いで、「ビンを軸に各区間に含まれる件数を棒で表した分布図」を選ばせる問題が出題されます。折れ線(時系列)・円(比率)・散布図(相関)との違いを明確に区別できることが重要です。

【パターン3:ビンサイズの影響】

ビンサイズを変えるとヒストグラムの形が変わり、分布の見え方や意思決定に影響する点も応用出題で問われます。適切なサイズ選択の判断力も試験で狙われるテーマです。

よくある間違い・紛らわしいポイント

【ビンをディメンションで作ろうとする】

×「ビンはディメンション・メジャーのどちらでも右クリックから作成できる」→○「ビンは連続する数値(メジャー)に対してのみ作成できる、ディメンション右クリックにはビン作成メニューが出ない」。連続値の区切りという定義から考えれば自然な制約です。

【ヒストグラムを棒グラフと同じ扱いで誤解】

×「ヒストグラムは普通の棒グラフと同じで、X軸がカテゴリ」→○「ヒストグラムはX軸が連続値のビン(区間)、通常の棒グラフはX軸がカテゴリで別物」。見た目は似ていても軸の意味が根本的に異なります。

【ビンサイズを設定しなくても同じ結果になると誤解】

×「ビンサイズはどの値でも分布の判断結果は変わらない」→○「ビンサイズを大きくすると粗い分布、小さくすると細かい分布で見え方が大きく変わる」。目的に合ったサイズ選択が分析の質を左右します。

まとめ・試験ポイント

  • ビン=連続する数値を一定の幅で区切ってグループ化したもの
  • ビンの作成=メジャーを右クリック →「作成」→「ビン」
  • ビンのサイズ設定が分布の見え方を左右する
  • ヒストグラム=ビンを軸に件数(COUNT)を棒で表した分布図
  • 「表示形式」から「ヒストグラム」を選ぶと自動作成できる
  • 分布の形(正規・偏り・外れ値)の読み取りが問われることがある

学習した内容を模擬試験で確認しよう。Tableau Desktop基礎(旧Specialist)模擬試験で実力を測ろう。

Tableau Desktop模擬試験に挑戦

実技で試したい方は、Tableau実践演習 初段にも挑戦してみよう。

実践演習 初段を見る