データの接続と準備(DA)

抽出の最適化と管理 — 増分更新・スケジュール・抽出フィルター

導入

何百万行ものデータを毎日フルで読み込んでいると、更新のたびに長い待ち時間が発生してしまいます。Tableauの抽出機能を使いこなすことで、パフォーマンスを維持しながら効率的なデータ更新が実現できるのではないでしょうか。

くわしく知ろう

Tableauの抽出(Extract)とは、データソースからデータを取得してTableau独自の形式(.hyper)としてローカルまたはサーバーに保存したものを指します。ライブ接続はクエリのたびにデータベースに問い合わせるのに対し、抽出は事前にデータを取り込んで高速に応答できる点が大きな特徴になっています。

抽出の更新には「完全更新」と「増分更新」の2種類があります。完全更新はデータソースの全データを毎回取得し直す方式で、確実ですが時間とリソースがかかります。増分更新は前回の更新以降に追加または変更されたレコードのみを取り込む方式で、更新時間を大幅に短縮できます。増分更新を使うには、日時型やID型の「増分基準フィールド」を指定する必要があります。

抽出フィルターを使うと、データソース全体ではなく必要な条件に絞ったデータのみを抽出できます。たとえば「過去2年分のデータだけを抽出する」「特定の地域のレコードのみを対象にする」といった絞り込みが可能で、.hyperファイルのサイズを抑えてパフォーマンスを改善できます。

Tableau CloudやTableau Serverでは、抽出のスケジュール更新を設定できます。スケジュール更新は時間・日次・週次などの間隔で自動実行されるため、常に最新データを保ちつつ手動更新の手間を省けます。増分更新とスケジュールを組み合わせると、大規模データセットでも実用的な更新サイクルを維持できます。

具体例

たとえば数百万行の販売履歴データを持つ場合、毎日フル更新すると数十分かかることがあります。日時フィールドを増分基準に設定して前日分のデータだけを取り込むようにすると、同じ更新が数分で完了するようになります。

まとめ・試験ポイント

  • 抽出(.hyper)=データをTableau形式でローカル/サーバーに保存して高速化
  • 完全更新=全データを再取得、増分更新=前回以降の差分のみ取得
  • 増分更新には日時型またはID型の「増分基準フィールド」の指定が必要
  • 抽出フィルター=条件を絞って.hyperファイルのサイズを削減
  • スケジュール更新=Tableau Cloud/Serverで更新を自動化できる
  • 試験では増分更新の前提条件(基準フィールドの必要性)と完全更新との違いが頻出

学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。

Tableau DA模擬試験を見る