事業継続とディザスタリカバリ — 災害後もビジネスを止めない
導入
大地震や大規模なシステム障害が発生したとき、銀行やAmazonがすぐにサービスを再開できるのはなぜでしょうか。それは「もしものとき」に備えた事業継続の仕組みを事前に作り上げているからです。
くわしく知ろう
事業継続計画(BCP:Business Continuity Plan)とは、災害やシステム障害などの緊急事態が発生しても、重要な業務を止めない・できるだけ早く再開するための事前計画のことです。
BCPを評価するうえで欠かせない指標が「RTO」と「RPO」です。RTO(Recovery Time Objective:目標復旧時間)は「障害発生からどれだけ早く業務を再開するか」の目標値を指します。RPO(Recovery Point Objective:目標復旧時点)は「どの時点のデータまで復旧を保証するか」の目標値を指します。たとえばRPOが1時間であれば、1時間以内ごとのデータはバックアップから必ず復元できる状態を目指すことになります。
バックアップサイトには3種類あります。ホットサイトはすべてのシステムが常時稼働しており、障害発生後すぐに切り替えられますが、コストが最も高くなっています。ウォームサイトはデータや機器は準備済みですが、稼働まで数時間かかるサイトです。コールドサイトは設備のみが確保されており、稼働まで数日以上かかる最もコストの低い構成です。
フェイルオーバーとは、本番システムに障害が発生した際に自動的にバックアップシステムへ切り替える仕組みを指します。
具体例
たとえばオンライン銀行では、RTOを数分以内・RPOをほぼゼロに設定し、ホットサイトを用いたフェイルオーバーで24時間サービスを維持しています。一方、書類作成が中心の中小企業では、コールドサイトで最低限の設備を確保しつつ、毎日夜間バックアップをとることでRPO24時間を目標とするケースも見られます。
まとめ・試験ポイント
- BCP=緊急事態でも重要業務を継続・早期再開するための事前計画
- RTO=障害発生後の目標復旧時間(「どれだけ早く再開するか」)
- RPO=目標復旧時点(「どの時点のデータまで保証するか」)
- ホットサイト>ウォームサイト>コールドサイト(復旧速度もコストも同順)
- フェイルオーバー=障害発生時に自動でバックアップシステムへ切り替える仕組み
- 試験ではRTOとRPOの定義の区別、3種類のバックアップサイトの比較が頻出
学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。
入門試験100問に挑戦する