Tableauとは ― BIツールの位置づけ
Tableauは、Salesforceが提供するBI(Business Intelligence)ツールです。 Excelの数値の羅列をドラッグ&ドロップだけでグラフや地図に変換し、 データを直感的に理解できるようにします。 プログラミングの知識がなくても本格的なデータ分析ができる点が大きな特徴です。
Tableauには用途に応じた複数の製品が用意されています。
- Tableau Desktop: 個人PCにインストールして使う分析・可視化ツール
- Tableau Server: 組織内でダッシュボードを共有するためのサーバー製品
- Tableau Cloud: Serverと同等の機能をクラウドで提供
- Tableau Public: 無料で作成・公開できるバージョン
- Tableau Prep: データの前処理(クレンジング・変換)に特化
Tableauのファイルは「ワークブック(.twb / .twbx)」と呼ばれ、 その中にワークシート(1つのグラフ)、ダッシュボード(複数ワークシートを1画面に配置)、 ストーリー(分析の流れを物語として伝える)という階層構造があります。
ディメンションとメジャー ― データ分類の基本
Tableauで最初に押さえるべき概念が「ディメンション」と「メジャー」の違いです。 データソースを接続すると、Tableauはフィールドを自動的にこの2つに分類します。
- ディメンション(質的データ):カテゴリ名、地域、日付など「何で分けるか」を定義するフィールド。 ビューに追加するとヘッダーが増え、データを分割します。
- メジャー(量的データ):売上金額、数量、利益など「いくつか」を示す数値フィールド。 ビューに追加するとSUM・AVGなどで集計されます。
たとえば「地域別の売上合計」を作るなら、「地域」がディメンション、「売上」がメジャーです。 ディメンションを追加するたびにビューの粒度が細かくなり、集計値が分割される点が重要です。
不連続と連続 ― 青と緑の違い
Tableauではフィールドの表示方法として「不連続(Discrete)」と「連続(Continuous)」の区別があります。 データペインやシェルフ上で色が異なるため、視覚的にすぐ見分けられます。
- 不連続(青色):個別の値としてヘッダーを作ります。棒グラフの軸ラベルのように「カテゴリA」「カテゴリB」と個別に表示されます。
- 連続(緑色):連続した軸を作ります。折れ線グラフの横軸のように、値がつながった1本の軸になります。
ディメンション=不連続、メジャー=連続がデフォルトですが、変更も可能です。 たとえば日付フィールドを「不連続の月」にすると月ごとのヘッダーが並び、 「連続の月」にすると時系列の連続軸になります。 この違いはビューの見え方を大きく左右するため、試験でも頻出のテーマです。
集計の仕組み ― SUMとAVGが変わる理由
Tableauではメジャーをビューに配置すると、デフォルトでSUM(合計)で集計されます。 ここで重要なのは、ビューに配置したディメンションの組み合わせによって集計の粒度が変わるという点です。
「売上の合計」をビューに置いた状態でディメンション「地域」を追加すると、 全体合計だった数値が地域ごとの合計に分割されます。 さらに「カテゴリ」を追加すると、地域×カテゴリごとの合計になります。 集計関数はSUMのままでも、ディメンションの追加で結果が変わるのがTableauの特徴的な挙動です。
集計関数はSUM以外にもAVG(平均)、COUNT(個数)、MIN/MAX(最小/最大)、 COUNTD(個別カウント)などを選択できます。 どの関数を使うかでビューの意味が変わるため、目的に応じた適切な選択が求められます。
データ接続 ― ライブ接続と抽出
Tableauでデータを扱うには、まずデータソースに接続する必要があります。 接続方式には「ライブ接続」と「抽出(エクストラクト)」の2種類があります。
- ライブ接続:データベースにリアルタイムでクエリを送信します。常に最新データを参照できますが、 大量データではパフォーマンスに影響する場合があります。
- 抽出(.hyper ファイル):データのスナップショットをローカルにコピーします。 高速な分析が可能で、オフラインでも作業できます。 ただしデータの更新にはスケジュール更新の設定が必要です。
複数のテーブルを組み合わせる方法には、結合(Join)、ユニオン(Union)、 リレーションシップがあります。 結合はテーブルを横方向につなぎ、ユニオンは縦方向に積み上げます。 リレーションシップはTableauが自動的に必要な結合を判断する新しい方式です。
基本的なチャートの種類
Tableauでは目的に応じて様々なチャートを作成できます。代表的なものを紹介します。
- 棒グラフ: カテゴリ間の比較に最適。最も基本的なビジュアライゼーション。
- 折れ線グラフ: 時系列の推移を表現。トレンドの把握に使います。
- 散布図: 2つのメジャーの相関関係を視覚化。トレンドラインの追加も可能。
- マップ: 地理データの可視化。シンボルマップや塗り分けマップが作れます。
- 二重軸グラフ: 異なるスケールの2つのメジャーを1つのビューに重ねて表示。
- ヒートマップ: セルの色の濃淡でデータの密度・強度を表現。
- ヒストグラム: データの分布を可視化。連続値をビン(区間)に分割。
ダッシュボードとストーリー
個別のワークシートで作成したビューは、ダッシュボードに配置して1画面にまとめることができます。 フィルターアクションを設定すれば、あるチャートをクリックすると他のチャートも連動してフィルターされる インタラクティブな画面を構築できます。
ストーリーは、ダッシュボードやワークシートを順序立てて並べ、 データ分析の流れを物語のように伝える機能です。 プレゼンテーションのスライドのように、ストーリーポイントを1つずつめくりながら 分析結果を説明できます。
Tableauの学習を始めよう
Tableauの基礎概念を理解したら、次は実際に手を動かして学習を深めましょう。 PassDojoではTableau Desktop入門向けの学習コンテンツを全40単元用意しています。 概念理解からデータ接続、チャート作成、ダッシュボード構築まで体系的に学べます。
Tableau入門学習コンテンツ
全40単元の体系的な学習コンテンツで、Tableauの基礎から応用まで段階的に学べます。 各単元に確認問題付きで、理解度を確認しながら進められます。
※ 本記事はTableau Desktop Specialist試験の学習を支援する目的で作成しています。 試験の最新情報はSalesforce(Tableau)の公式サイトをご確認ください。