データの接続と準備(DA)

データソースの種類と接続方法 — ファイル・DB・パブリッシュ済みソースの選び方

導入

Tableauでの分析はすべて、データソースへの接続から始まります。CSV・Excel・データベース・クラウドなど、どこにあるデータをどう読み込むかを正しく選ぶことが、スムーズな分析の第一歩になります。

なぜ重要か

データソース接続はDA試験(Tableau Certified Data Analyst)の「接続と準備」ドメインで冒頭に問われる必須テーマです。Desktop Specialistでも基本は扱われますが、DA試験ではファイル形式の違い・パブリッシュ済みデータソース・データソースの置き換えまで踏み込んだ出題があります。

実務でも「分析の出発点は接続」と言われるほど重要な工程であり、接続方式の選択次第で分析スピード・データ鮮度・共有性が大きく変わります。誤った接続方式を選ぶと、データ更新のたびに手作業が発生したり、チーム全体で定義が揃わなかったりと、後工程に大きな負担を残すことになります。

この単元で.tds/.tdsxの違い・3種類の接続方式・データソース置き換えを押さえておくと、次の「抽出最適化」の前提知識として活き、DA試験の接続関連の失点を防げます。

くわしく知ろう

Tableauが接続できるデータソースは大きく3種類に分けられます。1つ目はファイル接続で、CSV・Excel・テキストファイル・JSONなどをローカルまたはネットワーク上から読み込む方式を指します。導入が手軽で小規模な分析に向いていますが、データの更新のたびにファイルを差し替える手間があります。

2つ目はリレーショナルデータベースへの接続です。MySQL・PostgreSQL・SQL Serverなどのデータベースに直接つなぎ、最新データをリアルタイムで参照できる点が特徴として知られています。接続には通常、サーバー名・ポート・ユーザー名・パスワードといった認証情報が必要になります。

3つ目はパブリッシュ済みデータソースへの接続です。Tableau ServerまたはTableau Cloudにあらかじめ発行されたデータソースを複数人で共有・再利用できる方式になっています。組織全体でデータ定義を統一したい場合に特に有効です。

これらの接続設定は、Tableau Desktopの起動画面左ペインにある「接続」セクションから行います。「ファイルへ」「サーバーへ」「保存済みデータソース」の3区分で整理されているため、目的に応じて選択できます。

接続情報を保存するファイル形式として、.tds(データソース定義)と .tdsx(データソース定義+データを含むパッケージ)の2種類があります。.tds はデータソースへの接続情報のみを保存し、実データは含みません。一方 .tdsx はデータそのものをパッケージに含めるため、データベースに接続できない環境でもファイル単体で利用できます。

すでに作成済みのワークブックで接続先を変更したい場合は、メニューの「データ」→「データソースの置き換え」を使います。旧データソースのフィールドが新しいデータソースのフィールドに自動でマッピングされ、既存のビューをそのまま引き継ぐことができます。

具体例で理解する

たとえば社内の受注実績を分析する際、基幹システムのSQLデータベースに直接接続すれば常に最新データを参照できます。一方、外部から入手した調査データはCSVファイルで受け取ることが多く、手軽にTableauへ取り込める点で便利です。

試験での出題パターン

【パターン1:.tds と .tdsx の違いを問う問題】

「接続情報と実データを両方含むファイル形式はどれか」という形式で、.tdsx を選ばせる問題が頻出します。選択肢に .twb / .twbx / .tds / .tdsx が並び、ワークブックとデータソース定義の区別まで正確に押さえている必要があります。「x が付くとパッケージ(実データ同梱)」という覚え方で整理するのが近道です。

【パターン2:パブリッシュ済みデータソースの用途を問う問題】

「組織全体でデータ定義を統一し、複数ユーザーが同じ接続設定を再利用したい場合に最適な方法はどれか」という問いで、パブリッシュ済みデータソースを選ばせる問題が出題されます。ローカルのCSV/Excelに接続する案や、各自で接続を設定する案と比較して、共有・一元管理の利点を理解しているかが問われます。

【パターン3:データソースの置き換え】

既存のビューを維持したまま接続先を切り替える「データソースの置き換え」の存在と手順(データメニュー→データソースの置き換え)も出題対象です。フィールド名マッピングによって既存ビューが自動的に引き継がれる仕組みも押さえておきましょう。

よくある間違い・紛らわしいポイント

【.tds と .tdsx の混同】

×「.tds にはデータも含まれる/.tdsx は接続情報のみ」→○「.tds は接続情報のみ、.tdsx は接続情報+実データのパッケージ」。.twb と .twbx の関係と同じく「x が付くとデータ同梱パッケージ」と覚えると整理しやすく、試験で混同しにくくなります。

【パブリッシュ済みデータソースとパッケージファイルの混同】

×「パブリッシュ済みデータソースは .tdsx ファイルと同じもの」→○「パブリッシュ済みは Tableau Server/Cloud 上で共有される動的な接続、.tdsx はローカル保存の静的パッケージ」。前者は組織共有、後者はファイル配布という使い分けを明確にしましょう。

【データソース置き換えで既存ビューが壊れると誤解】

×「接続先を変えるとビューを作り直す必要がある」→○「フィールド名が一致していれば既存ビューを維持したまま置き換え可能」。名前が一致しないフィールドも手動マッピングで対応でき、フルリニューアルは不要な点が実務でも重要です。

まとめ・試験ポイント

  • ファイル接続=CSV・Excel・JSON等をローカルから読み込む手軽な方式
  • DB接続=MySQL・PostgreSQL等へ直接つなぎリアルタイムデータを参照
  • パブリッシュ済みデータソース=Server/Cloudで共有・再利用できる接続
  • .tds=接続情報のみ / .tdsx=接続情報+データを含むパッケージ
  • 「データソースの置き換え」でビューを維持しながら接続先を変更可能
  • 試験では .tds と .tdsx の違い、およびパブリッシュ済みデータソースの用途が問われやすい

学習した内容を模擬試験で確認しよう。Tableau Data Analyst模擬試験で実力を測ろう。

Tableau DA模擬試験に挑戦