ライブ接続か抽出か — パフォーマンスとリアルタイム性のトレードオフ
導入
データを「常に最新の状態で見たい」か「手元に持って素早く分析したい」か、どちらを優先するかによってTableauの接続方法の選び方が変わります。この選択は分析の快適さや正確さに直結する、いわば分析の土台となる判断です。
くわしく知ろう
ライブ接続とは、Tableauがデータベースやクラウドサービスに直接クエリを送り、その都度データを取得する方式を指します。ビューを操作するたびに最新のデータが反映されるため、リアルタイム性が求められる分析に向いています。ただし、クエリのたびにデータソース側へ負荷がかかるため、大規模なデータや応答速度の遅いデータベースでは操作が重くなる場合があります。
一方、抽出(エクストラクト)とは、データソースからデータのスナップショットを取り出し、Tableauの独自形式である.hyper(ハイパー)ファイルとしてローカルに保存する方式です。Tableauの高速エンジンで処理されるためパフォーマンスが大幅に向上し、データソースへの接続がない状態(オフライン)でも作業を続けられます。ただし、抽出した時点のデータが使われるため、元データが更新されても自動では反映されません。
抽出を最新の状態に保つには「更新」の操作が必要です。更新には2種類あり、全データを取り直す完全更新と、前回取得後に追加・変更されたデータだけを取り込む増分更新があります。増分更新は更新時間の短縮に効果的ですが、データソース側に日時などの識別列が必要です。
抽出作成時には「抽出フィルター」を設定することもできます。これは抽出に含めるデータを絞り込む機能で、Tableauのフィルター処理順序において最も上位(最初)に適用されます。大量データから必要な部分だけを抽出することでファイルサイズを抑え、パフォーマンスをさらに高めることができます。
DA試験では「抽出はスナップショットであり、元データへの変更は自動で反映されない」という点が頻出です。また、ライブ接続と抽出の使い分け基準(リアルタイム性 vs パフォーマンス)も問われます。
具体例
たとえば全社の売上データベースを複数人が常時参照するダッシュボードにはライブ接続が適しています。一方、月次レポート用に前月分のデータをまとめて分析する場合は抽出を使うと、データベースへの負荷をかけずに快適に操作できます。
まとめ・試験ポイント
- ライブ接続=データソースに直接クエリ→常に最新・DBへの負荷が高い
- 抽出=.hyperファイルにスナップショット保存→高速・オフライン作業可能
- 抽出は元データが変更されても自動反映されない(手動または定期更新が必要)
- 抽出の更新:完全更新(全件再取得)と増分更新(差分のみ)の2種類がある
- 抽出フィルター=抽出作成時にデータを絞り込む機能、フィルター処理順序の最上位
- 試験では「スナップショットで自動反映されない」「ライブ vs 抽出の使い分け」が頻出
学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。
Tableau DA模擬試験を見る