テクノロジ系

機械学習の入門 — 教師あり・なし・強化学習の違い

導入

スパムメールが自動でフィルタリングされたり、動画サービスがおすすめ作品を提案してくれたりするのは、機械学習の力によるものです。AIの中核をなす機械学習の種類と使いどころを確認していきます。

なぜ重要か

機械学習はAI（人工知能）を支える中核技術であり、医療診断・自動翻訳・不正検知・需要予測・画像認識など、私たちの生活のあらゆる場面にすでに組み込まれています。DX推進の文脈でも、「どの機械学習手法がこの業務課題に適しているか」を判断できる人材が求められています。

ITパスポートの試験では、機械学習の3種類の手法（教師あり・教師なし・強化学習）とその特徴・代表的な用途の組み合わせが繰り返し出題されます。専門家としての実装知識ではなく、「どの場面にどの学習方式を使うか」という概念レベルの理解が問われるため、定義と具体例をセットで押さえておくことが重要です。

くわしく知ろう

機械学習とは、大量のデータからコンピュータが自動でパターンやルールを学習する技術のことです。人間がすべてのルールを手作業で定義するのではなく、データから自らルールを見つけ出す点が特徴になっています。

教師あり学習は、「入力データ」と「正解ラベル」をセットにして学習させる手法です。メールのスパム判定（スパム/非スパムのラベル付きデータで学習）や画像認識（写真と「猫」「犬」などのラベルで学習）が代表例として知られています。

教師なし学習は、正解ラベルなしでデータの構造やグループを発見する手法を指します。似た属性の顧客をグループに分けるクラスタリング（顧客セグメンテーション）などが典型例です。データそのものの中に潜むパターンを自動的に発見することが目的になっています。

強化学習は、試行錯誤を繰り返してより良い行動方針を学習する手法です。将棋AIやゲームAIが報酬を最大化するために学習するプロセスがこれにあたります。「エージェント」が「環境」と相互作用しながら、報酬が最大になる行動を学んでいく仕組みです。

このほか、学習済みのモデルを別のタスクに転用する転移学習や、人間の脳の神経回路を模したニューラルネットワーク、その中でも特に多層構造を持つディープラーニング（深層学習）も試験に登場します。

具体例で理解する

たとえば、「スパムかどうかラベル付きのメール10万件」で学習させるのが教師あり学習です。一方、ラベルなしの購買データから「よく似た買い物をする顧客グループ」を自動で見つけるのが教師なし学習の活用場面です。ゲームAIが無数の対戦を繰り返して勝率を高めていくのが強化学習の典型例にあたります。

試験での出題パターン

【パターン1：学習手法の特徴と事例の組み合わせを問う問題】

「正解ラベルを使わずにデータのグループ分けを行う手法はどれか」という問いには教師なし学習（クラスタリング）が対応し、「スパム判定のようにラベル付きデータで学習する手法はどれか」という問いには教師あり学習が対応します。各手法を「ラベルあり・なし」「試行錯誤」というキーワードで整理しておくと判断が速くなります。

【パターン2：ニューラルネットワーク・ディープラーニングとの関係を問う問題】

「ディープラーニングは機械学習の一種か、別の技術か」という視点の問いも登場します。ディープラーニングはニューラルネットワークを多層化した機械学習の手法であり、機械学習の一種です。「AI → 機械学習 → ディープラーニング」という包含関係を把握しておくと、この種の問題で迷わなくなります。

よくある間違い・紛らわしいポイント

【教師なし学習＝クラスタリングとの混同】

クラスタリングは教師なし学習の代表的な手法のひとつですが、教師なし学習イコールクラスタリングではありません。教師なし学習には他にも次元削減・異常検知などの手法が含まれます。「クラスタリング→教師なし」の方向は正しいですが、「教師なし→クラスタリング」とは言い切れない点に注意してください。

【強化学習と教師あり学習の混同】

強化学習は「報酬という信号をもとに試行錯誤する」のが特徴で、あらかじめ正解ラベルが用意されているわけではありません。将棋AIに勝利・敗北という結果を報酬として与えて学習させるのが強化学習であり、「正解データで学習させる」教師あり学習とは仕組みが根本的に異なります。

【AIと機械学習とディープラーニングの範囲の誤解】

AIは最も広い概念で、機械学習はAIの実現手法の一つです。ディープラーニングは機械学習の中でもニューラルネットワークを深く積み重ねた手法を指します。「AI＝機械学習」「機械学習＝ディープラーニング」という誤った等号関係は試験でよく狙われる誤りです。

まとめ・試験ポイント

教師あり学習＝正解ラベルつきデータで学習（スパム判定・画像分類など）
教師なし学習＝正解なしでパターンを発見（クラスタリングなど）
強化学習＝試行錯誤で報酬を最大化する行動方針を学習（ゲームAIなど）
ニューラルネットワーク＝人間の脳の神経回路を模した学習モデル
AI→機械学習→ディープラーニングという包含関係を押さえる
試験では3種類の学習方式の特徴と代表的な用途の組み合わせがよく問われる

学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。

入門試験100問に挑戦する