ストラテジ系

システムの信頼性指標 — MTBF・MTTR・稼働率の計算

導入

システムが「めったに壊れない」「壊れてもすぐ直る」ことは、企業にとって死活問題です。その信頼性を数値で表すのがMTBF・MTTR・稼働率という3つの指標で、試験でも計算問題として頻繁に登場します。

なぜ重要か

ITパスポートのテクノロジ系分野において、システムの信頼性指標は計算問題として必ず出題されるテーマです。MTBF・MTTR・稼働率の3つは「定義を覚える」だけでなく「計算式を使いこなす」ことが求められるため、確実に得点源にしておく必要があります。

また実務においても、「サーバーの可用性(アベイラビリティ)をどう測るか」「システムを冗長化すると稼働率がどう変わるか」を定量的に示せることは、インフラ担当者やシステム発注者にとって欠かせないスキルです。オンラインサービスでは「99.9%の稼働率」(いわゆるスリーナイン)を保証するSLA(Service Level Agreement)が一般的になっており、この意味を理解するためにも稼働率の計算は実用的な知識です。

くわしく知ろう

MTBF(Mean Time Between Failures:平均故障間隔)とは、システムが正常に動作している時間の平均を指します。たとえば100時間稼働して2回故障した場合、MTBFは50時間となります。MTBFの値が大きいほど「壊れにくいシステム」といえます。

次にMTTR(Mean Time To Repair:平均修復時間)は、故障してから復旧するまでにかかった時間の平均を指します。同じく2回故障して合計修理時間が4時間であれば、MTTRは2時間です。MTTRが小さいほど「壊れても素早く直せるシステム」ということになります。

稼働率とは「全体の時間のうち、正常稼働していた時間の割合」を示す指標です。計算式は「MTBF ÷ (MTBF + MTTR)」で求められます。MTBF=50時間・MTTR=2時間であれば、稼働率は50÷52≒0.962(約96.2%)となります。

このほか、複数のシステムを組み合わせる場合の計算も重要です。直列接続では各コンポーネントの稼働率をかけ合わせた値が全体の稼働率になります。一方、並列接続(冗長構成)では片方が故障しても動き続けるため、全体の稼働率は直列より高くなります。並列接続の稼働率は「1 −(全コンポーネントが同時に故障する確率)」で計算します。

具体例で理解する

サーバーが年間に合計50時間停止し、その間に10回故障した場合、MTTR=50÷10=5時間となります。稼働率を高めるには「故障頻度を減らす(MTBFを上げる)」か「修理を素早くする(MTTRを下げる)」かの2方向があります。予備部品の用意はMTTRの短縮に、高品質部品の採用はMTBFの向上に効果があります。

試験での出題パターン

【パターン1:稼働率の計算問題】

「MTBFが○時間、MTTRが○時間のとき稼働率はいくらか」という形式が最も頻出です。MTBF ÷ (MTBF + MTTR) の計算式を確実に覚え、小数点以下3桁程度まで計算できるようにしておきましょう。分母を間違えて「MTBF + MTBF」としてしまうミスが多いため注意が必要です。

【パターン2:直列・並列の稼働率比較】

「稼働率0.9のシステム2台を直列接続したとき」「並列接続したとき」のそれぞれの稼働率を求める問題です。直列は0.9×0.9=0.81、並列は1−(1−0.9)×(1−0.9)=0.99 という計算手順を練習しておくと安心です。

【パターン3:施策の効果を問う問題】

「MTBFを上げる施策はどれか」「MTTRを下げる施策はどれか」という判断問題も出題されます。品質向上・予防保守はMTBF向上、予備部品の確保・リモート監視ツールの導入はMTTR短縮という対応関係を整理しておきましょう。

よくある間違い・紛らわしいポイント

【MTBFとMTTRの取り違え】

MTBFは「故障と故障の間の時間(正常稼働時間の平均)」、MTTRは「故障してから直るまでの時間(修復時間の平均)」です。名前が似ているため混同しやすいですが、「Between(間)=稼働中の時間」「To Repair(修復するまで)=停止中の時間」と語源から覚えると確実です。

【稼働率の分母の間違い】

稼働率の分母は「MTBF+MTTR」つまり稼働時間と停止時間の合計(=総時間)です。「MTBFだけ」や「MTTRを足し忘れる」ミスが多いので、計算式を書き出してから計算する習慣をつけましょう。

【並列接続の計算式の誤解】

並列接続の稼働率は「稼働率どうしを足す」のではなく、「1から全体が故障する確率を引く」という計算になります。稼働率0.9の2台並列なら「1−(0.1×0.1)=0.99」であり、単純に0.9+0.9=1.8とはなりません。確率の補数を使う点が落とし穴です。

まとめ・試験ポイント

  • MTBF=平均故障間隔(大きいほど壊れにくい)
  • MTTR=平均修復時間(小さいほど復旧が速い)
  • 稼働率=MTBF ÷ (MTBF + MTTR)
  • 直列接続=各稼働率の積(値は下がる)、並列接続=1−全体故障確率(値は上がる)
  • MTBFを上げる施策=品質向上・予防保守、MTTRを下げる施策=予備部品確保・監視強化
  • 試験では稼働率の計算式と直列・並列の違いが頻出

学習した内容を試験形式で確認しよう。ITパスポート入門試験100問に挑戦できます。

入門試験100問に挑戦する