データの探索と分析

データ準備のベストプラクティス — 分析を速くする設計判断

導入

Tableauの分析が思うように進まないとき、原因はデータの「形」にある場合が少なくありません。分析を速くするためのデータ設計を事前に知っておくと、作業効率が大きく変わります。

なぜ重要か

データ準備のベストプラクティスはTableau Desktop Specialist試験の「データ接続と準備」領域で出題される重要トピックで、ロング形式/ワイド形式の違い・ピボット機能の目的・正規化やPrep Builderの役割が問われます。分析の土台となる工程です。

実務でも「Tableauでうまく集計できない」という悩みの9割は、ロング形式で受けるべきデータをワイド形式で受けてしまっていることが原因です。データの形を最初に整えられるかで、その後の分析効率と正確性が大きく変わります。Tableau Prep Builderを使えばデータクレンジングの視覚的管理も可能です。

この単元でロング/ワイドの違い・ピボット機能・正規化・接続方式選択を押さえておくと、次の「元データ表示」「試験対策総復習」と合わせてデータ品質管理の全体像が完成します。

くわしく知ろう

Tableauが最も得意とするデータの形は「ロング形式(縦持ち)」と呼ばれるものです。ロング形式とは、1行が1件のデータを表し、属性ごとに列が独立しているシンプルな構造を指します。一方、「ワイド形式(横持ち)」とは複数の項目が横方向に並んだ構造で、人間には読みやすいものの、Tableauでの集計には向いていません。

Tableauにはワイド形式のデータを縦持ちに変換する「ピボット」機能が備わっています。データソース画面で列を選択してピボットを適用するだけで、分析しやすい形に整形できます。

また、分析パフォーマンスを高めるにはデータの正規化も重要です。重複するデータを別テーブルに分けて整合性を保つことで、クエリの効率が上がります。接続方式の選択もパフォーマンスに影響します。データ量が多く更新頻度が低い場合は抽出(.hyper形式)が適しており、常に最新データが必要な場合はライブ接続を選びます。

より本格的なデータ整形が必要な場合はTableau Prep Builderを使うと、クリーニング・結合・ピボットなどの操作をフローとして視覚的に管理できます。

具体例で理解する

たとえば「1月売上」「2月売上」「3月売上」という列が横に並ぶワイド形式のシートは、ピボット機能で「月」と「売上」の2列に変換するとTableauでの分析が一気に容易になります。

試験での出題パターン

【パターン1:適したデータ形式を問う問題】

「Tableauが分析に適しているデータ形式として最も正しいものはどれか」という形式で、「1行が1件のデータを表すロング形式(縦持ち)」を選ばせる問題が頻出します。「月ごとの売上が横方向に並ぶワイド形式」「集計済み」「ピボット済みExcel」などの誤答に注意が必要です。

【パターン2:ピボット機能の目的を問う問題】

「データソース画面でピボット機能を使う主な目的はどれか」という問いで、「横持ち(ワイド形式)を縦持ち(ロング形式)に変換する」を選ばせる問題が出題されます。集計・結合・重複削除などの誤答と区別できることが鍵です。

【パターン3:接続方式の選択】

大量データ・低頻度更新なら抽出、最新データ必須ならライブ接続という使い分けや、本格的なクリーニングならPrep Builderを使うといった判断も応用出題の対象です。

よくある間違い・紛らわしいポイント

【ワイド形式をそのまま使おうとする】

×「ワイド形式の表のままTableauで分析できる」→○「ロング形式に変換してからが基本、ワイド形式はピボットで縦持ちに変換する」。人間に読みやすい形と分析しやすい形は異なる点を押さえましょう。

【ピボット機能を集計と混同】

×「ピボット機能はデータを集計してグラフに変換する」→○「ピボットは形式変換(横→縦)の機能、集計とは別物」。Excelのピボットテーブルとは役割が異なる点に注意しましょう。

【接続方式の選択基準を誤解】

×「大量データにはライブ接続が最適」→○「大量データ・低頻度更新なら抽出が高速、ライブ接続は最新データが必要な場面向け」。データ量・更新頻度・リアルタイム性の3軸で判断するのが正攻法です。

まとめ・試験ポイント

  • ロング形式(縦持ち)=Tableauが得意な形・1行1件のシンプルな構造
  • ワイド形式(横持ち)はピボット機能で縦持ちに変換できる
  • データの正規化=重複をなくし整合性を保つ設計
  • 大量データ・低頻度更新 → 抽出が適切、最新データ必須 → ライブ接続
  • Tableau Prep Builder=データクリーニング・整形を視覚的に行うツール
  • 試験ではロング形式とワイド形式の違いやピボットの目的が問われやすい

学習した内容を模擬試験で確認しよう。Tableau Desktop基礎(旧Specialist)模擬試験で実力を測ろう。

Tableau Desktop模擬試験に挑戦

実技で試したい方は、Tableau実践演習 初段にも挑戦してみよう。

実践演習 初段を見る