データサイエンティスト検定 リテラシーレベルとは
データサイエンティスト検定 リテラシーレベル(本記事では以降「データサイエンティスト検定(リテラシーレベル)」と表記します)は、一般社団法人データサイエンティスト協会が主催する民間資格試験です。データを扱う実務に就く前段階として必要な知識・スキルを測定することを目的としており、学生・文系社会人・ITエンジニア志望者まで幅広い層に受験されています。2021年9月の第1回実施以降、累計受験者数は2万名を超え、データ系資格のなかでも認知度が高まっています。
「リテラシーレベル」という名称が示すとおり、同協会が定義するデータサイエンティストのスキルレベル体系のなかで、入門〜中級層を対象とした位置づけです。上位資格として「データサイエンティスト検定 プロフェッショナルレベル(★★★)」が将来的に設定される予定ですが、2026年4月時点では「★(リテラシーレベル)」が主に実施されているレベルです。
主催団体(一般社団法人データサイエンティスト協会)
一般社団法人データサイエンティスト協会は、データサイエンティストの育成・普及を目的として2013年に設立された業界団体です。会員企業には大手IT企業・コンサルティングファーム・製造業などが名を連ね、産業界でのデータ活用推進を担っています。同協会が策定した「データサイエンティストスキルチェックリスト」が試験出題範囲の基盤となっており、実務家の視点を色濃く反映した試験設計が特徴です。
試験の公式情報は同協会のウェブサイト(https://www.datascientist.or.jp/dscertification/)で公開されており、受験申込・合格率の公表もこちらから確認できます。
試験概要(CBT形式・100問・100分・受験料11,000円)
試験はCBT(Computer Based Testing)形式で実施されます。全国のテストセンターで受験でき、年に複数回開催されるため、自分のペースで受験時期を選べる点が利便性の高さにつながっています。試験の主な仕様は以下のとおりです。
| 項目 | 内容 |
|---|---|
| 試験方式 | CBT(Computer Based Testing) |
| 問題数 | 約100問 |
| 試験時間 | 100分 |
| 受験料 | 11,000円(税込) |
| 合格基準 | 正答率80%前後(回によって変動) |
| 受験資格 | なし(誰でも受験可能) |
| 合否通知 | 受験後すぐに画面で確認可能 |
択一式・複数選択式の問題が混在しており、単純な知識の暗記だけでなく、データサイエンスの概念を文脈に沿って選択する思考力も問われます。時間配分としては1問あたり60秒を目安にすると時間切れを防ぎやすくなります。
試験の歴史と受験者規模(第1回2021年9月〜、累計2万名超)
データサイエンティスト検定 リテラシーレベルは2021年9月に第1回が実施されました。当初はデータ分析の実務経験者や情報系学生が中心でしたが、DXへの社会的関心の高まりとともに文系社会人・転職希望者・大学生の受験者も増加傾向にあります。
累計受験者数は2万名を超えており(同協会公表データによる)、受験者の属性は文系・理系・社会人・学生と多様です。試験の知名度が上がるにつれて、IT企業や製造業でのスキル評価指標としても参照されるようになっています。なお、回ごとの合格率は同協会の公式ページ(https://www.datascientist.or.jp/dscertification/results/)で公開されています。
出題範囲と3つのスキルカテゴリ
データサイエンティスト検定(リテラシーレベル)の出題範囲は、データサイエンティスト協会が公表する「データサイエンティストスキルチェックリスト」に基づいています。スキルは大きく3つのカテゴリに分類されており、それぞれ独立して学習することも相互連携させて学ぶことも可能です。
データサイエンス力(統計・機械学習)
データサイエンス力は、統計学・機械学習・データ解析の理論的知識を扱う領域です。具体的には、基本統計量(平均・分散・標準偏差)、確率分布、仮説検定、回帰分析、分類・クラスタリングのアルゴリズム概要、評価指標(精度・再現率・F値など)といったトピックが含まれます。
リテラシーレベルでは「どのような場面でどの手法を使うか」という選択の妥当性を問う問題が多く出題されます。機械学習の数式を解くような深い数学的計算は求められませんが、各手法の特性・前提・適用条件を理解しておく必要があります。たとえば「外れ値に強い統計量はどれか」「過学習を防ぐための方法はどれか」という形式の設問に答えられる理解度が目安です。
統計の基礎学習という観点では、統計検定2〜3級レベルの知識と重なる部分が多く、統計検定を先行学習してからデータサイエンティスト検定(リテラシーレベル)に臨むルートも有効です。詳細は統計検定の各レベル徹底比較ガイドをあわせてご覧ください。
データエンジニアリング力(データ処理・SQL等)
データエンジニアリング力は、データの収集・加工・管理・可視化に関する実践的な知識を問う領域です。SQL(SELECT・JOIN・GROUP BY・サブクエリ等の基礎)、データベース設計の基本概念、データパイプライン、ETL処理、データ品質管理、BIツールの活用といったトピックが含まれます。
この領域はプログラミング経験のない受験者にとってもっとも苦戦しやすい分野です。SQLの基本構文は実際に手を動かして書いてみることが理解の近道であり、オンライン学習サービスで基礎コースを1〜2週間こなすだけで大幅に得点力が上がります。データエンジニアリングの知識は実務でも直結する場面が多く、合格後のキャリアへの投資価値が高い分野でもあります。
データエンジニアリングの体系的な知識を深めたい場合は、データマネジメント試験との接続も視野に入れておくとよいでしょう。データマネジメントの活用課題と実践では、データエンジニアリング力とデータガバナンスのつながりを解説しています。
ビジネス力(課題設定・コミュニケーション)
ビジネス力は、データサイエンスの知識をビジネスの文脈で活用するための思考力・コミュニケーション能力を問う領域です。具体的には、ビジネス課題の定義、KPI設計、分析結果の解釈と意思決定への活用、ステークホルダーへの説明能力、倫理的データ活用(プライバシー・バイアス・説明責任)といったトピックが含まれます。
この領域は純粋な暗記では対応しにくく、「なぜそのアプローチが有効か」「データ分析の結果をどう意思決定に結びつけるか」を論理的に考える訓練が必要です。ビジネス経験のある社会人受験者が有利になりやすい分野でもあります。文系出身者でもビジネス力で高得点を稼ぎ、数理系問題との点数差を埋めるという戦略が有効です。
数理・データサイエンス・AI教育モデルカリキュラムとの対応
文部科学省・経済産業省の支援のもと数理・データサイエンス・AI教育強化拠点コンソーシアムが策定した「数理・データサイエンス・AI教育モデルカリキュラム」は、大学教育レベルでのデータサイエンス人材育成の指針です。データサイエンティスト検定(リテラシーレベル)の出題範囲と、このカリキュラムの「リテラシーレベル」「応用基礎レベル」の知識領域が大きく重なっており、大学のデータサイエンス関連科目を履修済みの学生には有利に働きます。
逆に言えば、社会人として独学で受験する場合も、このカリキュラムの教材(各大学が公開しているOCW等)を参照することが効率的な学習法のひとつです。「データサイエンス入門系の授業コンテンツ+公式テキスト」の組み合わせで網羅的な知識を身につけることができます。
難易度と合格率の実態
データサイエンティスト検定(リテラシーレベル)は、「入門資格」として紹介されることもありますが、実態としては合格率が50%を下回る回も多く、しっかりとした準備が必要です。ここでは合格基準・合格率の推移・難しい問題パターンの3つの観点から難易度の実態を整理します。
正答率80%前後という合格基準
データサイエンティスト検定(リテラシーレベル)の合格基準は公式サイトによると「各分野での一定水準以上の正答率」とされており、目安として80%前後の正答率が求められると言われています。約100問中80問程度を正解する必要があるため、苦手分野があると全体の足を引っ張りやすい試験設計です。
また、3つのスキルカテゴリそれぞれで一定の基準点をクリアすることが求められる可能性があるため、特定分野への偏った学習ではなく、バランスよく全カテゴリをカバーすることが合格への近道です。「データサイエンス力は得意だがデータエンジニアリング力は未学習」という状態で受験すると、総得点が高くても不合格になるリスクがあります。
回別の合格率推移(第1回〜直近、43〜48%前後)
データサイエンティスト協会が公表している合否結果によれば、第2回以降の合格率は43〜48%前後で推移しています。第1回(2021年9月)は約66%と高めの合格率でしたが、これは受験者層が意識の高い先行受験者中心であったためと考えられます。第2回以降、受験者層の広がりとともに合格率が40%台後半で安定するようになりました。
| 時期(目安) | 合格率(公式データより) | 傾向 |
|---|---|---|
| 第1回(2021年9月) | 約66% | 先行受験者中心、やや高め |
| 第2回以降(2022年〜) | 43〜47%前後 | 受験者層の広がりとともに安定 |
| 直近(2024〜2025年頃) | 43〜48%前後 | 問題の難化・易化により変動 |
注意: 合格率の数値は公式サイト(https://www.datascientist.or.jp/dscertification/results/)で公表されている値に基づいています。具体的な回ごとの数値は受験前に公式サイトで最新情報を確認してください。
合格率が40%台という数値は、ITパスポート試験(50〜60%台)と比較するとやや低く、準備なしの受験では不合格になる可能性が十分あります。一方で、100時間程度の計画的な学習で合格水準に到達できる受験者も多く、難易度は「準備すれば越えられる壁」と評価するのが妥当です。
難しい問題パターンの傾向
受験者の声や問題傾向の分析から、データサイエンティスト検定(リテラシーレベル)で得点しにくい問題パターンには以下の傾向があります。
第一に、「最も適切でないものを選べ」という否定型設問です。正しいものを選ぶ問題より注意が必要で、すべての選択肢の妥当性を正確に判断する必要があります。第二に、SQLクエリの実行結果を問う問題です。頭のなかでクエリを実行する訓練が必要で、実際にコードを書いた経験がない場合は特に得点しにくい傾向があります。第三に、機械学習の評価指標の使い分けです。精度・再現率・適合率・F値・AUCといった指標を「どのビジネスシーンで何を優先すべきか」という観点で選ぶ設問が出題されます。
これらの問題パターンへの対策としては、公式テキストの例題だけでなく、過去問・模擬試験で出題形式に慣れることが効果的です。問題の見た目のパターンに慣れることが、本番での判断スピードを上げる鍵になります。
勉強法と学習ロードマップ
データサイエンティスト検定(リテラシーレベル)は独学での合格が十分可能な試験ですが、学習の出発点となる知識レベルによって効率的な学習ルートは異なります。ここでは学習時間の目安、公式テキストの使い方、模擬試験・問題集の活用法の3点に絞って解説します。
目安の学習時間
バックグラウンドによって必要な学習時間は大きく異なります。以下を参考に自分のスタート地点を確認してください。
| バックグラウンド | 目安学習時間 | 重点分野 |
|---|---|---|
| 統計・ML・SQLの知識がほぼゼロ | 100〜150時間 | 全カテゴリを均等に、SQLを重点的に |
| ITパスポート・基本情報合格レベル | 60〜80時間 | データサイエンス力・統計を重点的に |
| 統計検定2〜3級取得済み | 40〜60時間 | データエンジニアリング力とビジネス力を強化 |
| データ分析実務経験あり(3年以上) | 20〜40時間 | 出題範囲の確認と問題形式への慣れ |
学習開始から試験まで2〜3ヶ月の期間を確保し、前半でインプット(テキスト精読)、後半でアウトプット(問題演習)に充てるスケジュールが一般的に効果的です。直前2週間は苦手分野の集中復習と問題形式への慣れを優先させましょう。
公式テキスト(白本・黒本)の使い方
データサイエンティスト検定(リテラシーレベル)の学習には、通称「白本」と「黒本」の2種類の公式テキストが活用されています。
「白本」と呼ばれるのは、データサイエンティスト協会公認の教科書的なテキストで、3つのスキルカテゴリの知識体系を体系的に解説しています。インプット学習のベースとなる一冊で、まずはこちらから読み進めるのが定番ルートです。知識ゼロから始める場合、白本を2周読むことで試験範囲の全体像を把握することができます。
「黒本」は問題集・実践演習系のテキストで、過去問や模擬問題を通じてアウトプット演習ができます。白本でインプットを終えたあとに黒本の問題演習を繰り返すことが、点数の底上げに最も直結する学習法です。解説が丁寧な問題集を選ぶことも重要で、解説を読んで「なぜその答えなのか」を理解するプロセスを省略しないようにしましょう。
テキストのバージョンは試験のシラバス改訂に対応したものを使うことが重要です。購入の際は最新版かどうかを確認してください。
模擬試験・問題集の活用法
公式テキストでの学習後は、模擬試験や問題集を活用して「アウトプット」の訓練を積むことが合格への最短路です。模擬試験はできるだけ本番に近い形式(100問・100分・CBT形式)で解く機会を確保することが重要で、時間内に解き終える感覚を養うことが目的のひとつです。
問題演習の際は「解けなかった問題の分野を記録し、テキストに戻って理解を補強する」サイクルを繰り返すことが効果的です。正解できた問題でも「なぜ他の選択肢が間違いなのか」を説明できるかを確認することで、知識の定着度が大きく上がります。
PassDojoでは、データマネジメントの基礎知識をインタラクティブな形式で確認できる学習コンテンツを提供しています。データサイエンティスト検定(リテラシーレベル)の準備と並行して、データ管理・データ品質の周辺知識を整理しておくと、試験対策と実務への応用の両方に役立ちます。
G検定・統計検定との比較・使い分け
データ・AI分野の資格を検討するとき、データサイエンティスト検定(リテラシーレベル)、G検定(JDLA Deep Learning for GENERAL)、統計検定はよく比較される3資格です。それぞれが異なるスキル軸・受験者層・活用場面に対応しているため、目的に応じた使い分けが重要です。
3検定のポジショニング比較表
以下の比較表では、便宜上「DS検定」(データサイエンティスト検定 リテラシーレベルの略)と「G検定」(JDLA Deep Learning for GENERAL)、「統計検定」の3つを横断的に整理します。DS検定はデータサイエンティスト検定(リテラシーレベル)、G検定はJDLA Deep Learning for GENERALをそれぞれ指します。
| 比較項目 | データサイエンティスト検定 (リテラシーレベル) | G検定(JDLA Deep Learning for GENERAL) | 統計検定(2級) |
|---|---|---|---|
| 主催団体 | データサイエンティスト協会 | 日本ディープラーニング協会(JDLA) | 日本統計学会 |
| 試験形式 | CBT・択一(約100問・100分) | オンライン自宅受験(多肢選択・200問程度) | CBT・計算問題含む(60〜90分) |
| 受験料 | 11,000円(税込) | 12,000円(税込) | 4,000〜6,000円程度 |
| 合格率 | 43〜48%前後 | 60〜65%前後 | 約35%前後(CBT移行後・2級) |
| 主な出題軸 | 統計・ML・SQL・ビジネス活用 | ディープラーニング・AI倫理・法制度 | 統計理論・確率・検定・推定 |
| プログラミング | 不要(概念理解が中心) | 不要(概念理解が中心) | 不要(手計算・選択) |
| 向いている人 | データ分析実務志望・文理問わず | AI活用・DX推進担当・文系社会人 | 統計の理論的理解を深めたい人 |
| キャリアでの評価 | データ分析・BI・コンサル | AI企画・DX戦略・プロダクト | 研究職・学術・データサイエンティスト上位 |
3資格のうち、知識の重複が多いのはデータサイエンティスト検定(リテラシーレベル)とG検定(JDLA Deep Learning for GENERAL)の組み合わせです。両試験ともプログラミング不要で概念理解中心であり、片方の学習内容がもう片方の準備にもなる側面があります。統計検定は数学的な計算が含まれるため、他の2試験とは学習スタイルが異なります。
推奨取得ルート(文系・理系・AIエンジニア志望別)
志望するキャリアによって、どの資格からスタートするかは変わります。以下に代表的な3パターンを示します。
文系ビジネスパーソン・DX推進担当の場合は、まずG検定(JDLA Deep Learning for GENERAL)でAIとデジタル化の全体像を把握し、次にデータサイエンティスト検定(リテラシーレベル)でデータ分析の実務基礎を補強するルートが効果的です。G検定は合格率が比較的高く、文系出身者にとってエントリーしやすい資格です。
理系学生・統計・データサイエンス志望の場合は、統計検定3〜2級で理論的な統計の土台を築いてから、データサイエンティスト検定(リテラシーレベル)で実務・エンジニアリング・ビジネス活用の知識を加えるルートが堅実です。大学のカリキュラムと統計検定の学習が重なる場合が多く、効率的に学習できます。
AIエンジニア志望・機械学習エンジニアを目指す人の場合は、データサイエンティスト検定(リテラシーレベル)でリテラシー層の知識を整理しつつ、Pythonプログラミングと機械学習の実践学習を並行させるルートが現実的です。検定合格後は、より実践的な資格(AWS機械学習スペシャリスト、Google Professional ML Engineer等)へのステップアップも視野に入れましょう。
データマネジメント試験・プロフェッショナルデジタルスキル試験との接続
データサイエンティスト検定(リテラシーレベル)の合格後、さらにキャリアを伸ばすうえで知っておきたいのが、2027年度に開始が予定されているIPA関連の新試験との接続です。
データマネジメント試験(仮称)は、データの収集・蓄積・品質管理・ガバナンスに関するスキルを問う試験として構想されています。データサイエンティスト検定(リテラシーレベル)のデータエンジニアリング力領域と知識が重なる部分が多く、特にデータ品質管理・メタデータ管理・データカタログといったトピックはデータマネジメント試験の核心領域でもあります。データエンジニアリング力の知識を土台にすることで、データマネジメント試験の学習が効率化されます。詳細はデータマネジメント試験とは?概要と対策をご覧ください。
プロフェッショナルデジタルスキル試験(仮称)は、DX推進・データ活用・AI活用の各領域で専門人材として認定される試験として計画されています。IPAが公表したデジタルスキル標準 Ver.2.0(DSS v2.0)と連動しており、データサイエンティスト類型のスキルレベル4〜5相当の知識を問う試験区分が含まれます。データサイエンティスト検定(リテラシーレベル)の合格がリテラシー層の土台を証明する一方、プロフェッショナルデジタルスキル試験はプロフェッショナル層を認定するポジションです。
DSS v2.0とプロフェッショナルデジタルスキル試験の関係についてはプロフェッショナルデジタルスキル(データ・AI)試験の出題範囲で詳しく解説しています。また、DSS v2.0の全体像についてはデジタルスキル標準 Ver.2.0とは?2026年改訂の全体像と5つの重要変更点を参照してください。
現時点(2026年4月)では、データサイエンティスト検定(リテラシーレベル)からデータマネジメント試験(仮称)、さらにプロフェッショナルデジタルスキル試験(仮称)という段階的なステップアップのルートが、データ系人材のキャリアパスとして現実的な選択肢になってきています。どのルートを選ぶかは、目指す職種・業界・スキルの優先順位によって異なりますが、まずはリテラシーレベルの資格として取得できるデータサイエンティスト検定(リテラシーレベル)は多くの方にとって有効な出発点といえます。
データ・AI系試験の基礎をPassDojoで固める
データサイエンティスト検定の学習と並行して、データマネジメントの基礎知識を体系的に整理しておくと合格後のキャリアにも役立ちます。PassDojoの入門学習コンテンツで、試験と実務の両方に通じる知識を身につけましょう。
まとめ:向いている人・向いていない人
ここまでデータサイエンティスト検定(リテラシーレベル)について、試験概要から難易度・勉強法・他資格との比較まで幅広く解説してきました。最後に、この試験が向いている人・向いていない人を整理して、受験を判断する際の参考にしてください。
データサイエンティスト検定(リテラシーレベル)が向いている人は以下のような方です。データ分析の仕事に転職・異動を検討しており、スキルを客観的に証明したい方。文系出身でデータ活用の基礎知識を体系的に身につけたい社会人。大学でデータサイエンス・情報系の授業を受けており、学習の成果を資格として可視化したい学生。ITパスポートや基本情報技術者試験に合格しており、次のステップとしてデータ分析系の資格を取得したい方。
一方、向いていない人・注意が必要な人もいます。すでにデータ分析実務を3年以上経験しており、資格よりもポートフォリオや実績評価のほうが採用で有効な方は、費用対効果を慎重に検討してください。純粋にディープラーニング・生成AIの知識を証明したい場合は、G検定(JDLA Deep Learning for GENERAL)のほうがより直接的にニーズに応えます。また、統計の理論を深く学びたい場合は統計検定のほうが適しています。
総じて、データサイエンティスト検定(リテラシーレベル)は「データを扱うすべての職種のリテラシー基準」として機能する試験です。データ分析職・BI担当・コンサルタント・DX企画担当など、データに触れる幅広い職種において、基礎的なスキルの証明として有効に機能します。しっかりとした準備をしたうえで、ぜひ合格を目指してください。
よくある質問
データサイエンティスト検定 リテラシーレベルの合格率はどのくらいですか?
回によって変動しますが、43〜48%前後が目安です。正答率80%前後が合格基準の目安とされており、問題数は約100問です。難易度はG検定(JDLA Deep Learning for GENERAL)よりやや高く、統計検定2級よりは広く浅いとされています。合格率の最新情報は一般社団法人データサイエンティスト協会の公式サイト(https://www.datascientist.or.jp/dscertification/results/)で確認することをおすすめします。
データサイエンティスト検定 リテラシーレベルの勉強時間はどのくらい必要ですか?
統計・機械学習の知識がまったくない方で100〜150時間、ITパスポートや基本情報技術者試験合格レベルの方で60〜80時間が目安です。公式テキスト(白本・黒本)と過去問演習を組み合わせた学習が効果的です。学習期間としては2〜3ヶ月を確保し、前半でインプット・後半でアウトプット演習に充てるスケジュールが一般的に推奨されています。
G検定とデータサイエンティスト検定 リテラシーレベルはどちらを先に取るべきですか?
AI・ディープラーニング方面のキャリアを目指す場合はG検定(JDLA Deep Learning for GENERAL)を先に、統計・データ分析実務を目指す場合はデータサイエンティスト検定(リテラシーレベル)を先に取るのが一般的な考え方です。文系ビジネスパーソンには、両試験とも基礎として「数理・データサイエンス・AI教育モデルカリキュラム」レベルの知識習得から始めることを推奨します。学習内容に重複も多いため、1つ合格した後にもう1つに挑戦する流れが効率的です。
【出典】一般社団法人データサイエンティスト協会「データサイエンティスト検定 公式情報」(https://www.datascientist.or.jp/dscertification/)、同「合否結果」(https://www.datascientist.or.jp/dscertification/results/)。本記事の数値情報(合格率等)は公式サイト掲載の公表データをもとにしています。受験前に最新情報を公式サイトで確認することを推奨します。