← プロデジ(データ・AI)想定問題集 トップへ
科目B: 事例問題(問41〜50)
問43
【事例1つづき】B社はさらに、店舗ごとの特性(近隣にスポーツ施設がある、観光地である等)をモデルに反映して予測精度を高めたいと考えている。データ分析担当者は、各店舗の立地特性を示すフラグ的な特徴量を追加することを提案した。この追加を検討するプロセスとして、CRISP-DMの観点から最も適切な進め方はどれか。
Aビジネス理解フェーズに立ち返って立地特性の仮説と分析目的との整合を確認し、データ理解・データ準備フェーズで特徴量候補のデータ収集・品質確認を行ったうえで、モデリング・評価フェーズで精度向上効果と汎化性能を検証して展開要否を判断する
Bデータ準備フェーズで特徴量を追加したら、それ以降のフェーズはスキップして直ちに本番展開する
C評価フェーズで既存モデルが基準を満たしているため、新たな特徴量の検討は全て不要とする
Dモデリングフェーズのみで特徴量を増やし続け、ビジネス理解やデータ理解には戻らない
解説
CRISP-DMは各フェーズが反復的に連携するモデルです。新しい特徴量の追加は、ビジネス理解での仮説整合 → データ理解・準備での品質確認 → モデリング・評価での精度と汎化性能の検証 → 展開要否判断、というサイクルで進めるのが適切です。評価・展開を飛ばす運用はリスクが高く、検討省略は精度向上機会の喪失につながります。