データの探索と分析
データ準備のベストプラクティス — 分析を速くする設計判断
導入
Tableauの分析が思うように進まないとき、原因はデータの「形」にある場合が少なくありません。分析を速くするためのデータ設計を事前に知っておくと、作業効率が大きく変わります。
くわしく知ろう
Tableauが最も得意とするデータの形は「ロング形式(縦持ち)」と呼ばれるものです。ロング形式とは、1行が1件のデータを表し、属性ごとに列が独立しているシンプルな構造を指します。一方、「ワイド形式(横持ち)」とは複数の項目が横方向に並んだ構造で、人間には読みやすいものの、Tableauでの集計には向いていません。
Tableauにはワイド形式のデータを縦持ちに変換する「ピボット」機能が備わっています。データソース画面で列を選択してピボットを適用するだけで、分析しやすい形に整形できます。
また、分析パフォーマンスを高めるにはデータの正規化も重要です。重複するデータを別テーブルに分けて整合性を保つことで、クエリの効率が上がります。接続方式の選択もパフォーマンスに影響します。データ量が多く更新頻度が低い場合は抽出(.hyper形式)が適しており、常に最新データが必要な場合はライブ接続を選びます。
より本格的なデータ整形が必要な場合はTableau Prep Builderを使うと、クリーニング・結合・ピボットなどの操作をフローとして視覚的に管理できます。
具体例
たとえば「1月売上」「2月売上」「3月売上」という列が横に並ぶワイド形式のシートは、ピボット機能で「月」と「売上」の2列に変換するとTableauでの分析が一気に容易になります。
まとめ・試験ポイント
- ロング形式(縦持ち)=Tableauが得意な形・1行1件のシンプルな構造
- ワイド形式(横持ち)はピボット機能で縦持ちに変換できる
- データの正規化=重複をなくし整合性を保つ設計
- 大量データ・低頻度更新 → 抽出が適切、最新データ必須 → ライブ接続
- Tableau Prep Builder=データクリーニング・整形を視覚的に行うツール
- 試験ではロング形式とワイド形式の違いやピボットの目的が問われやすい
学習した内容を模擬試験で確認しよう。Tableau Desktop Specialist模擬試験で実力を測ろう。
Tableau模擬試験を見る