マネジメント系

SLAとサービスレベル管理 — 約束を数値で守る仕組み

導入

「このシステムは年間99.9%の稼働を保証します」――ビジネスでよく見かけるこの数値は、一体どのくらいの停止を許容しているのでしょうか。ITサービスの品質を数値で約束する仕組み「SLA」について確認していきます。

くわしく知ろう

SLA(Service Level Agreement:サービスレベル合意)とは、ITサービスの提供者と利用者の間で、サービス品質の水準を文書化して合意する取り決めのことです。「どの程度の品質を保証するか」を事前に明文化することで、双方の認識のずれをなくす役割を持っています。

SLAで定める指標のうち最もよく使われるのが可用性(稼働率)です。稼働率は「システムが利用可能な時間 ÷ 全体の時間 × 100」で計算されます。稼働率99.9%の場合、年間の停止時間は約8.76時間(365日×0.1%)となります。一方、稼働率99.99%では年間停止時間は約52分まで短縮されます。「9」の数が増えるほど停止許容時間が大幅に減ることを覚えておきましょう。

SLAで定める指標にはほかに、応答時間(リクエストへの返答速度)、障害発生件数、問い合わせへの対応時間なども含まれます。SLAを達成できなかった場合のペナルティ(返金・割引など)についても合意書に盛り込まれることが一般的です。

SLAを継続的に監視・改善する活動をサービスレベル管理(SLM:Service Level Management)と呼びます。ITILというITサービス管理のベストプラクティス集でも重要なプロセスとして位置づけられています。

具体例

たとえばクラウドサービスのAWS(Amazon Web Services)は主要サービスに対して月間99.9%以上の稼働率をSLAで保証しており、下回った場合はクレジット返金を行っています。月間720時間のうち停止許容時間はわずか約43分で、それを超えると利用者は補償を請求できます。

まとめ・試験ポイント

  • SLA=サービス提供者と利用者の間でサービス品質を合意した文書
  • 稼働率(可用性)=稼働時間 ÷ 全体時間 × 100(%)
  • 稼働率99.9%=年間停止許容時間は約8.76時間
  • SLM=SLAを継続的に監視・改善するプロセス(ITILの一部)
  • 試験では稼働率の計算問題と「SLAの目的」を問う問題が頻出

学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。

入門試験100問に挑戦する