SLI / SLO / SLA の違いと使い分け — 提案書で失敗しないサービスレベル設計入門
IoT システムや SaaS の提案書を書いていると、お客様から「このシステム、ちゃんと動くんですか?」と聞かれます。この質問にどう答えるか で、契約交渉の主導権が決まります。 「99.9% 動きます」と言い切れば SLA(契約)になり、下回ったら違約金。「目標値です」と言えば SLO(内部目標)で、未達でも返金義務はない。この 1 文字違いで法的拘束力が変わります。 本記事では、SRE(Site Reliability Engineering)業界で標準となっている SLI / SLO / SLA の 3 用語の 違いと使い分け を、提案書を書く立場から整理します。 3 用語の違い(要点) 略語 正式名 一言で 性格 SLI Service Level Indicator 計測する指標 データ SLO Service Level Objective 目指す目標 内部約束 SLA Service Level Agreement 契約上の保証 対外契約 順序は SLI → SLO → SLA で考えます。 SLI で「何を測るか」を決める(例: イベント検知から通知メール送信までの遅延時間) SLO で「目標値」を内部で握る(例: 95%ile が 60 秒以内) SLA で「契約条項」に格上げする(例: SLO 違反が月 3 件超えたら月額の 10% 返金) なぜ 3 つに分かれているのか Google SRE Book が提唱した「エラーバジェット」の考え方が背景にあります。 ...