プロフェッショナルデジタルスキル(データ・AI)試験

データ分析プロセス — 目的設定から可視化・意思決定まで

導入

「データはあるのに活用できていない」という声をよく耳にします。実はその原因の多くは、データが不足しているのではなく、「何を明らかにしたいのか」という問いが先に定まっていないことにあります。分析はデータ収集より先に目的を設定するところから始まります。

くわしく知ろう

データ分析プロセスは、目的設定・データ収集と整備・集計・可視化・意思決定という流れで進みます。まず目的設定では、KGI(Key Goal Indicator:最終的な事業目標)を定め、そこから逆算してKPI(Key Performance Indicator:測定可能な進捗指標)を導きます。「売上を20%伸ばす」というKGIに対して「カート完了率」や「リピート購入率」をKPIとして設定するイメージです。仮説思考も重要で、「なぜそうなっているか」の見立てを先に持つことで、収集すべきデータが絞られます。

次に、データ収集と整備の段階です。ETL(Extract・Transform・Load)はソースから抽出し変換してDWH(データウェアハウス)に格納する手順を指します。収集後は欠損値の補完や重複の除去といったクレンジングを経て、分析できる状態に整えます。

集計の段階では、ディメンション(分類軸:地域・時間帯・デバイスなど)とメジャー(数値:売上・件数など)を組み合わせてデータを多角的に見ていきます。OLAP(Online Analytical Processing)はこの多次元分析を素早く行う技術です。スライスは特定の値で絞り込む操作、ダイスは複数のディメンションを同時に絞り込む操作、ドリルダウンは上位集計から下位の詳細データへと掘り下げる操作を指します。

可視化では、目的に応じてチャートを使い分けます。棒グラフは量の比較、折れ線グラフは時系列の推移、散布図は2変数の相関の確認、ヒートマップはディメンションの交差セルに値を色で表すときに適しています。

レポート作成(ナレーティング)では、数字を並べるだけでなく「だから何をすべきか」という示唆まで伝えることが求められます。BIツール(Business Intelligence:SoI=Systems of Insight)を使うと、ダッシュボードを共有して自動更新レポートを実現できます。なお分析結果に相関関係が見えても、それが因果関係(原因と結果)であるとは限りません。この区別は意思決定の質を大きく左右するため、常に意識が必要です。

具体例

ECサイトのカート放棄率改善プロジェクトでは、まずKPIを「カート完了率」に設定し、ログデータをデバイス×時間帯でドリルダウンしました。ヒートマップでモバイル深夜帯の離脱が集中していると可視化され、「決済画面のステップが多い」という仮説を立ててA/Bテストで検証、UI改善の意思決定につなげました。

まとめ・試験ポイント

  • 分析プロセスの順序=目的設定(KGI/KPI)→データ収集・整備→集計→可視化→意思決定
  • OLAP操作の3種=スライス(1軸で絞る)・ダイス(複数軸で絞る)・ドリルダウン(上位→詳細に掘り下げる)
  • ETL=抽出→変換→格納、ELT=抽出→格納→変換(クラウド型で普及)
  • チャート選択:棒(比較)・折れ線(推移)・散布図(相関)・ヒートマップ(交差セルの強弱)
  • 相関≠因果:2変数が連動しても一方が他方の原因とは限らない(疑似相関に注意)
  • SoI(BIツール)=データをインサイトに変換し自動レポートで意思決定を支援する仕組み

※本コンテンツは2026年3月公表の改定案 Ver.1.0 に基づく暫定版です

学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。

入門試験100問に挑戦する