データ接続と準備

データに接続する — ライブ接続と抽出の使い分け

導入

Tableauでデータを分析するには、まずデータソースへの接続方法を選ぶ必要があります。「ライブ接続」と「抽出」のどちらを使うかによって、データの鮮度とパフォーマンスが大きく変わるため、状況に応じた使い分けが重要です。

なぜ重要か

データソース接続はTableau Desktop Specialist試験の「接続と準備」領域で冒頭に問われる必須テーマで、ライブ接続と抽出の使い分けが頻出論点として知られています。分析の出発点となる工程であり、ここを誤ると後続の分析全体に影響します。

実務でもリアルタイム性とパフォーマンスのトレードオフを理解して接続方式を選べるかが、ダッシュボードの実用性を左右します。株価や在庫のようなリアルタイム性重視のケースと、月次レポートのような更新頻度が低く高速性重視のケースで、適切な方式を即座に判断できる力は現場で頻繁に求められます。

この単元でライブ接続と抽出の特徴・.hyperファイル・スケジュール更新を押さえておくと、次の「フィールドプロパティ」「階層とフィルター」「日付フィルター」「ビン/ヒストグラム」といった接続後の操作知識に自然につながっていきます。

くわしく知ろう

ライブ接続とは、データベースやクラウドサービスに直接問い合わせる接続方式を指します。ビューを開いたり操作したりするたびにリアルタイムでクエリが実行されるため、常に最新のデータを参照できます。ただし、クエリのたびにデータソース側のサーバーに負荷がかかるため、大規模データや遅いネットワーク環境では応答速度が落ちる場合があります。

一方、抽出(エクストラクト)とは、データソースからデータのスナップショットを取り出し、Tableauの独自形式である.hyper(ハイパー)ファイルとしてローカルに保存する方式です。抽出したデータはTableauの高速エンジンで処理されるため、大規模データでも快適に操作できます。ただし、抽出した時点のデータが使われるため、元データが更新されても自動では反映されません。Tableau Server / Cloudを利用している場合はスケジュール更新を設定することで、定期的に最新データを取り込むことができます。

Tableauが接続できるデータソースは多岐にわたり、ExcelやCSVなどのファイル、SQL Server・OracleなどのリレーショナルデータベースのほかSalesforce・Google Analyticsといったクラウドサービスにも対応しています。

具体例で理解する

たとえば株価や在庫数のようにリアルタイム性が求められる分析にはライブ接続が向いています。一方、月次の売上レポートのように更新頻度が低く、素早くビューを操作したい場面では抽出を選ぶと快適に作業できます。

試験での出題パターン

【パターン1:抽出接続の特徴を問う問題】

「抽出(エクストラクト)接続の特徴として最も適切なものはどれか」という形式で、「データのスナップショットを.hyperファイルに保存し高速に操作できる」を選ばせる問題が頻出します。「毎回データソースに直接クエリ」(ライブ接続の特徴)、「サーバー負荷が大きい」「ExcelとCSVのみ対応」といった誤答に注意が必要です。

【パターン2:接続方式の選択を問う問題】

「リアルタイム変化するデータを常に最新の数値で分析したい場合の最適接続は」という問いで、「ライブ接続」を選ばせる問題が出題されます。スケジュール更新を1時間ごとに設定しても「常に最新」ではない点が紛らわしい選択肢として狙われます。

【パターン3:.hyperファイル形式の知識】

Tableauの抽出が.hyperファイルとして保存される点や、Tableau Server/Cloudでスケジュール更新を自動化できる点も出題対象です。

よくある間違い・紛らわしいポイント

【ライブ接続と抽出の特性を逆に覚える】

×「ライブ接続は.hyperファイルに保存される」→○「.hyperファイルは抽出形式、ライブ接続はデータソースに直接クエリ」。ファイル保存=抽出、直接問い合わせ=ライブ、という対応で覚えましょう。

【抽出のスケジュール更新で「常に最新」と誤解】

×「抽出でスケジュール更新を短い間隔にすれば常に最新データが反映される」→○「スケジュール更新の間隔分だけ常にラグがある、真のリアルタイム性が必要ならライブ接続を選ぶ」。1時間スケジュールでも直前1時間分のデータは反映されません。

【接続可能ソースをファイルのみと誤解】

×「抽出はExcelとCSVのみ対応、データベースには使えない」→○「データベース・クラウドサービス(Salesforce/Google Analytics等)も抽出対応可能」。接続可能なソースの広さもTableauの強みです。

まとめ・試験ポイント

  • ライブ接続=毎回データソースに直接問い合わせ→常に最新・サーバー負荷大
  • 抽出=.hyperファイルに保存→高速・最新でない場合あり
  • 抽出の更新はスケジュール設定で自動化可能(Server/Cloud)
  • 接続可能なソース=Excel / CSV / DB / クラウドサービスなど多数
  • 試験ではライブ接続と抽出の特徴・メリット・デメリットの比較が頻出

学習した内容を模擬試験で確認しよう。Tableau Desktop基礎(旧Specialist)模擬試験で実力を測ろう。

Tableau Desktop模擬試験に挑戦

実技で試したい方は、Tableau実践演習 初段にも挑戦してみよう。

実践演習 初段を見る