データの接続と準備(DA)

ライブ接続か抽出か — パフォーマンスとリアルタイム性のトレードオフ

導入

データを「常に最新の状態で見たい」か「手元に持って素早く分析したい」か、どちらを優先するかによってTableauの接続方法の選び方が変わります。この選択は分析の快適さや正確さに直結する、いわば分析の土台となる判断です。

なぜ重要か

ライブ接続と抽出の使い分けは、DA試験の「データの接続と準備」ドメインで必ず問われるトピックです。両者の特性と処理順序、更新タイミングの違いは選択問題の定番で、インクリメンタル更新や抽出フィルターの挙動まで関連して出題されます。

実務でも、ダッシュボードの応答速度や最新性の要求に応じて接続方式を選ぶ判断は、毎プロジェクトで求められます。トレードオフを正確に把握しておくことが、性能問題を未然に防ぐ基礎になります。

くわしく知ろう

ライブ接続とは、Tableauがデータベースやクラウドサービスに直接クエリを送り、その都度データを取得する方式を指します。ビューを操作するたびに最新のデータが反映されるため、リアルタイム性が求められる分析に向いています。ただし、クエリのたびにデータソース側へ負荷がかかるため、大規模なデータや応答速度の遅いデータベースでは操作が重くなる場合があります。

一方、抽出(エクストラクト)とは、データソースからデータのスナップショットを取り出し、Tableauの独自形式である.hyper(ハイパー)ファイルとしてローカルに保存する方式です。Tableauの高速エンジンで処理されるためパフォーマンスが大幅に向上し、データソースへの接続がない状態(オフライン)でも作業を続けられます。ただし、抽出した時点のデータが使われるため、元データが更新されても自動では反映されません。

抽出を最新の状態に保つには「更新」の操作が必要です。更新には2種類あり、全データを取り直す完全更新と、前回取得後に追加・変更されたデータだけを取り込む増分更新があります。増分更新は更新時間の短縮に効果的ですが、データソース側に日時などの識別列が必要です。

抽出作成時には「抽出フィルター」を設定することもできます。これは抽出に含めるデータを絞り込む機能で、Tableauのフィルター処理順序において最も上位(最初)に適用されます。大量データから必要な部分だけを抽出することでファイルサイズを抑え、パフォーマンスをさらに高めることができます。

DA試験では「抽出はスナップショットであり、元データへの変更は自動で反映されない」という点が頻出です。また、ライブ接続と抽出の使い分け基準(リアルタイム性 vs パフォーマンス)も問われます。

具体例で理解する

たとえば全社の売上データベースを複数人が常時参照するダッシュボードにはライブ接続が適しています。一方、月次レポート用に前月分のデータをまとめて分析する場合は抽出を使うと、データベースへの負荷をかけずに快適に操作できます。

試験での出題パターン

DA試験でライブ vs 抽出の設問は、主に3つの型があります。

パターン1:特性の違いを直接問う問題。「スナップショットで自動反映されないのはどちらか」「.hyperファイル形式はどちらか」「オフラインで作業できるのはどちらか」を選ばせます。

パターン2:更新方式を問う問題。完全更新と増分更新の違い、増分更新を使うために必要な条件(日付などの識別列)を選択肢に並べて正誤を判断させます。

パターン3:抽出フィルターの処理順序を問う問題。フィルター処理順序の最上位に抽出フィルターが位置する点、データソースフィルターやコンテキストフィルターとの関係を並べ替えさせる形式が頻出です。

よくある間違い・紛らわしいポイント

×「抽出でも元データ変更が自動反映される」→○ 抽出はスナップショットのため、元データが変わっても自動では反映されません。最新化したい場合は完全更新や増分更新の操作が必要です。

×「増分更新はどのデータソースでも使える」→○ 増分更新には日付やIDなどの差分識別列が必要です。これがないデータソースでは完全更新しか選べません。

×「抽出フィルターとデータソースフィルターは同じ」→○ 抽出フィルターは.hyper作成時に適用される最上位のフィルターです。データソースフィルターは抽出の後段で、ビュー操作時のクエリに条件を追加します。処理順序と用途が異なります。

まとめ・試験ポイント

  • ライブ接続=データソースに直接クエリ→常に最新・DBへの負荷が高い
  • 抽出=.hyperファイルにスナップショット保存→高速・オフライン作業可能
  • 抽出は元データが変更されても自動反映されない(手動または定期更新が必要)
  • 抽出の更新:完全更新(全件再取得)と増分更新(差分のみ)の2種類がある
  • 抽出フィルター=抽出作成時にデータを絞り込む機能、フィルター処理順序の最上位
  • 試験では「スナップショットで自動反映されない」「ライブ vs 抽出の使い分け」が頻出

学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。

Tableau DA模擬試験に挑戦