ストラテジ系

ビッグデータとデータ活用 — 大量のデータから価値を引き出す

導入

SNSの投稿、ネットショッピングの履歴、信号機のセンサーデータ――世界中で毎日膨大な量のデータが生まれています。そのデータをうまく活用することで、企業は新たなビジネスチャンスを見つけたり、社会課題の解決に役立てたりできるようになっています。

くわしく知ろう

ビッグデータとは、従来のデータベースや分析ツールでは扱いきれないほど大量かつ多様なデータのことを指します。その特徴は「3つのV」で表現されることが多く、Volume(データ量の膨大さ)・Velocity(データ生成・処理のスピード)・Variety(テキスト・画像・音声など多様な形式)の頭文字をとったものです。

ビッグデータを蓄積・管理するための基盤として、データレイクとデータウェアハウスという2つの概念があります。データレイクとは、生のデータをフォーマットや用途を問わず大量に保存しておく「池」のような場所のことです。一方、データウェアハウスは、分析しやすい形式に整理・加工したデータを保管する「倉庫」のような仕組みになっています。

実際のデータ活用では、収集したデータを可視化して傾向を把握するデータ分析や、機械学習(コンピュータにデータからパターンを学ばせる技術)と組み合わせて将来を予測する取り組みが広がっています。ITパスポートでは、3つのVの意味と、データレイク・データウェアハウスの違いが問われることがあります。

具体例

たとえば、動画配信サービスが「この利用者には次にどの作品を勧めるか」をリコメンドできるのは、視聴履歴という大量のデータを分析しているからです。また、コンビニが天気や曜日のデータをもとに仕入れ量を調整するのも、ビッグデータ活用の身近な例といえます。

まとめ・試験ポイント

  • ビッグデータの3V=Volume(量)・Velocity(速度)・Variety(多様性)
  • データレイク=生データをそのまま大量保存する基盤
  • データウェアハウス=分析用に整形・加工済みデータを保管する基盤
  • 機械学習と組み合わせて予測・推薦に活用される
  • 試験では3Vの各要素の意味や、データレイクとデータウェアハウスの違いを問う出題がみられる

学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。

入門試験100問に挑戦する