SLAとサービスレベル管理 — 約束を数値で守る仕組み
導入
「このシステムは年間99.9%の稼働を保証します」――ビジネスでよく見かけるこの数値は、一体どのくらいの停止を許容しているのでしょうか。ITサービスの品質を数値で約束する仕組み「SLA」と、それを継続的に管理する取り組みについて確認していきます。
なぜ重要か
ITパスポート試験では、SLA(サービスレベル合意)とサービスレベル管理が毎回出題される頻出テーマです。「SLAの目的を問う問題」と「稼働率の計算問題」の両方が登場するため、概念の理解と計算力の両方が求められます。
また、クラウドサービスを活用する企業が増えた現代では、SLAは発注者・受注者の双方にとって契約の根拠となる重要な文書です。「99.9%と99.99%の違いは何か」を説明できる社会人は、ITサービスの調達や評価の場面で大きなアドバンテージを持ちます。さらにITILというIT管理フレームワークにおいてもサービスレベル管理は中心的なプロセスとして位置づけられており、実務でIT部門と連携するすべての担当者にとって理解が求められる知識です。
くわしく知ろう
SLA(Service Level Agreement:サービスレベル合意)とは、ITサービスの提供者と利用者の間で、サービス品質の水準を文書化して合意する取り決めのことです。「どの程度の品質を保証するか」を事前に明文化することで、双方の認識のずれをなくす役割を持っています。
SLAで定める指標のうち最もよく使われるのが可用性(稼働率)です。稼働率は「システムが利用可能な時間 ÷ 全体の時間 × 100」で計算されます。稼働率99.9%の場合、年間の停止時間は約8.76時間(365日×24時間×0.001)となります。一方、稼働率99.99%では年間停止時間は約52分まで短縮されます。「9」の数が増えるほど停止許容時間が大幅に減ることを覚えておきましょう。
SLAで定める指標にはほかに、応答時間(リクエストへの返答速度)、障害発生件数、問い合わせへの対応時間なども含まれます。SLAを達成できなかった場合のペナルティ(返金・割引など)についても合意書に盛り込まれることが一般的です。
SLAを継続的に監視・改善する活動をサービスレベル管理(SLM:Service Level Management)と呼びます。ITILというITサービス管理のベストプラクティス集でも重要なプロセスとして位置づけられています。
具体例で理解する
クラウドサービスのAWSは主要サービスに対して月間99.9%以上の稼働率をSLAで保証しており、下回った場合はクレジット返金を行っています。月間720時間のうち停止許容時間はわずか約43分で、それを超えると利用者は補償を請求できます。このように、SLAは利用者の権利を守るための重要な契約上の根拠となっています。
試験での出題パターン
【パターン1:SLAの目的・定義を問う問題】
「SLA(サービスレベル合意)の説明として最も適切なものはどれか」という形で4択から選ぶ問題が頻出です。選択肢には「障害復旧手順を定めたマニュアル」「ソフトウェアの利用料金を定めたライセンス契約」などが並びます。SLAは「品質水準の合意文書」であり、手順書でもライセンス契約でもないという点を押さえましょう。
【パターン2:稼働率の計算問題】
「稼働率99.9%の場合、年間の停止許容時間として最も近いものはどれか」という計算問題が定期的に出題されます。式は「365日×24時間×(1-稼働率)」で求められます。99.9%なら約8.76時間、99.99%なら約52分という数値を計算できるよう練習しておきましょう。
よくある間違い・紛らわしいポイント
【SLAとSLMの混同】
SLA(サービスレベル合意)は「品質水準を合意した文書・契約」です。SLM(サービスレベル管理)はその合意を継続的に監視・評価・改善する「活動・プロセス」を指します。SLAが「約束の内容」でSLMが「約束を守るための管理活動」と整理すると区別しやすくなります。
【稼働率99.9%と99.99%の数値の混同】
「9が一つ増えるだけで停止時間は大幅に変わる」という感覚を持っておくことが大切です。99.9%(スリーナイン)の年間停止許容時間は約8.76時間ですが、99.99%(フォーナイン)では約52分と10分の1以下に減ります。試験では「約8.76時間」と「約52分」が同じ設問に選択肢として並ぶことが多いため、どちらの稼働率に対応する数値かを正確に覚えておきましょう。
【SLAとBCPの混同】
BCP(事業継続計画)は「大規模災害などの緊急事態が起きたとき、事業をどう継続するかの計画」です。SLAは「通常運用時のサービス品質の合意」であり、目的と場面が異なります。障害時の対応手順はSLAではなくBCPや障害対応手順書の領域であることを覚えておきましょう。
まとめ・試験ポイント
- SLA=サービス提供者と利用者の間でサービス品質を合意した文書
- 稼働率(可用性)=稼働時間 ÷ 全体時間 × 100(%)
- 稼働率99.9%(スリーナイン)=年間停止許容時間は約8.76時間
- 稼働率99.99%(フォーナイン)=年間停止許容時間は約52分
- SLM=SLAを継続的に監視・改善するプロセス(ITILの一部)
- 試験では稼働率の計算問題と「SLAの目的」を問う問題が頻出
学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。
入門試験100問に挑戦する