「作れること」の価値が消える AI 時代に、SRE / プロダクション・エンジニアリングの重要性が上がる理由

integrated1453氏のポストが、すてぃお(@suthio_)氏の note 記事「『作れること』の価値が消えていくAI時代にソフトウェアエンジニアは何をやるべきか」に対して、SRE の視点からコメントし、98いいね、81ブックマーク、約12,600表示と反響を呼んでいます。

エンジニアにとって、より高度にSREをやっていくことの重要性が上がるという話だと思った。プロダクションで起こっている問題をデバッグして修正して再発防止するとか、それらを再現性高く実行できる仕組みを作るとか、SREがやる運用のエンジニアリングそのもの。まずは障害対応100本ノックしよう!笑 — integrated1453

元のすてぃお氏の投稿は552いいね、759ブックマーク、約87,900表示とさらに大きな反響です。すてぃお氏は adding Inc. 代表取締役で、元スタートアップ CTO。Claude Code の登場以降、AI 時代のエンジニア像について一貫した発信を続けています。

すてぃお氏の主張 — 「作れる」から「動かし続ける」へ

核心のテーゼ

すてぃお氏の一連の記事を横断する主張は明確です。

Claude Code を使い始めてから、僕の開発方法は根本的に変わりました。以前は「この処理を実装するのに3日くらいかかるな」と見積もっていたものが、今は適切な指示を出せば30分で形になる。

実装スキル単体の市場価値が低下し、求められるのは以下の能力だという主張です。

低下する価値上昇する価値
コードを書く能力コードを読んで検証する能力
実装の速さ仕様・制約の設計力
個別機能の開発自己修復・自己改善するシステムの設計
技術力単体技術力 × ビジネス力

すてぃお氏の提案する3つの方向性

  1. 「勝手に動き続ける仕組み」を作る: 修正する人ではなく、自己修復・自己改善するシステムの設計者になる
  2. コードは「読めるけど書けない」でいい: エンジニアの主要業務が「書く能力」から「読む能力」へ転換
  3. 事業成長にコミットする: 技術へのコミットメントよりも事業成長へのコミットメントが重要

integrated1453 氏の洞察 — これは SRE の話だ

integrated1453 氏のコメントの核心は、すてぃお氏の「動かし続ける仕組みを作る」という主張を、SRE(Site Reliability Engineering)のコンテキストに接続したことです。

SRE が担う「動かし続ける」

すてぃお氏の表現SRE の対応する実践
自己修復するシステムSelf-healing infrastructure、自動ロールバック
自己改善するシステムポストモーテムからの自動ガードレール生成
再現性高く実行できる仕組みInfrastructure as Code、ランブック自動化
プロダクションの問題をデバッグオブザーバビリティ、分散トレーシング
再発防止SLO/SLI 定義、エラーバジェット管理

「作れること」の価値が下がるなら、「動かし続けること」の価値が相対的に上がる。これは論理的に自然な帰結です。

なぜ SRE は AI に置き換えられにくいのか

コード生成と運用の非対称性

AI コーディングツールが急速に進化する一方で、プロダクション環境の運用には AI が対処しにくい特性があります。

特性コード生成プロダクション運用
入力の予測可能性高い(仕様→コード)低い(未知の障害パターン)
フィードバックループ即時(テスト通過/失敗)遅延(本番で数週間後に発現)
コンテキストの範囲ファイル/リポジトリ内インフラ全体 + ビジネスコンテキスト
失敗のコスト低い(やり直し可能)高い(ダウンタイム、データ損失)
判断の曖昧さ低い(正解が明確)高い(トレードオフの連続)

gihyo.jp のインタビューでスリーシェイク代表の吉田拓真氏が述べているように、「パブリッククラウドが隆盛したときに『インフラエンジニアは死ぬ』と散々言われたが結局死ななかった」のと同様のパターンです。抽象化・自動化が進むほど、その裏側を理解し、壊れたときに対処できる人材の希少性が上がります

AI SRE ツールの現在地

2026年時点で AI SRE ツールは急速に進化しています。

ツール機能
New Relic SRE Agentテレメトリー分析、根本原因推論、修正 PR 自動生成
Sherlocks.ai協調型インシデントレスポンス
Resolve.ai自動修復ワークフロー
Harness AI SRE検知→診断→修復の自動化パイプライン
AgentSREエージェント型 AI によるインシデント管理

しかしこれらのツールは SRE を 置き換える のではなく、増強する 設計です。InfoQ の報告によると、2026年の業界コンセンサスは「AI が推奨し、人間が承認し、システムが実行する」ハイブリッドワークフローです。

デスキリング問題 — AI 依存の落とし穴

AI が SRE の補助となる一方で、SigNoz のニュースレターは「AI は SRE を置き換えていない。デスキリングしている」と警鐘を鳴らしています。

デスキリングの仕組み

AI がインシデント対応の大部分を処理すると、人間の SRE は稀にしか発生しない高度な問題への対応能力を失います。これは1983年の認知心理学の研究に基づく知見で、自動化のパラドックスと呼ばれます。

領域事例
医療AI 支援を使用した内視鏡医の無支援検出率が 28% → 22% に低下
航空自動操縦依存パイロットの状況認識能力が低下。FAA が手動飛行時間を義務化
SREAI がアラート分析・既知障害の自動修復を処理 → 人間は未知の障害に弱くなる

「ネバースキリング」というさらに深刻な問題

既存の SRE がスキルを失う「デスキリング」以上に深刻なのは、**新入りの SRE が最初から深い実践経験を積む機会を持たない「ネバースキリング」**です。AI が Tier 1/2 の障害を全て処理すると、ジュニア SRE はいきなり Tier 3 の未知の障害に直面することになります。

対策 — 意図的な非効率性

SigNoz の記事は、FAA のパイロット訓練に倣い、自動化可能な事象でも意図的に人間が対応する「学習機会」を確保することを提案しています。

推奨されるアプローチ:
1. 定期的な「アナログドリル」: AI 支援なしでのインシデント対応訓練
2. 認知的関与の設計: 単なる承認者ではなく、AI と並行して問題に関与
3. ローテーション制: 自動化レベルを意図的に下げた期間を設ける

integrated1453 氏の「まずは障害対応100本ノックしよう!」は、まさにこのデスキリング対策を実践レベルで表現しています。

AI 時代の SRE に求められるスキル

従来の SRE スキル + 新しいスキル

カテゴリ従来のスキルAI 時代に追加されるスキル
オブザーバビリティメトリクス・ログ・トレースの設計AI テレメトリー分析の検証、LLM ワークロードの監視
インシデント対応障害の検知・対応・復旧AI 自動修復の監督、AI が対応できない障害のエスカレーション
信頼性設計SLO/SLI 定義、エラーバジェットAI エージェントの信頼性設計(ガードレール、権限制御)
自動化IaC、CI/CD パイプラインAI エージェントのワークフロー設計、プロンプトエンジニアリング
ポストモーテム根本原因分析、再発防止策AI 支援による分析の加速 + 人間の判断による妥当性検証

SRE が AI にもたらす2つの価値

LayerX のエンジニアブログが整理するように、SRE が AI にもたらす価値は2つの軸で整理できます。

内容
コンテキストAI がより良く動作するための下地テレメトリー収集、IaC によるコード化、ポストモーテムの整備
ガードレールAI の失敗を予防・回復するための保険自動ロールバック、カナリアデプロイ、フィーチャーフラグ

AI が生成するコードが増えるほど、そのコードを本番で安全に動かすための SRE の仕事は増えます。

実践ロードマップ — 明日から何をすべきか

SRE に興味がある開発者向け

integrated1453 氏の「障害対応100本ノック」を実践するための具体的なステップです。

ステップアクションリソース
1. オブザーバビリティの基礎メトリクス・ログ・トレースの3本柱を理解するSRE Book(Google)
2. インシデント対応の訓練Game Day / Chaos Engineering を実施GremlinLitmusChaos
3. ポストモーテムの習慣化障害の根本原因分析と再発防止策を文書化Blameless ポストモーテムガイド
4. IaC の習得Terraform / Pulumi でインフラをコード化HashiCorp Learn
5. SLO/SLI の設計ユーザー視点の信頼性指標を定義OpenSLO

既に SRE をやっている人向け

アクション目的
AI SRE ツールの評価自チームのワークフローに適合するツールを選定
デスキリング対策の導入AI なしでのインシデント対応ドリルを定期実施
AI エージェントの信頼性設計AI が生成するコードのデプロイパイプラインにガードレールを設計
LLM ワークロードの監視AI エージェント自体のオブザーバビリティを構築

まとめ

  • 「作れること」の価値が低下し、「動かし続けること」の価値が上昇: AI がコード生成を加速する一方、プロダクション環境の運用には未知の障害パターン、ビジネスコンテキスト、トレードオフの判断力など AI が対処しにくい特性がある
  • SRE はこの文脈で最も価値が上がる専門領域の一つ: プロダクションの問題のデバッグ、再発防止、再現性の高い仕組みの構築は、AI 時代においてもエンジニアリングの中核
  • AI SRE ツールは SRE を置き換えるのではなく増強する: 2026年の業界コンセンサスは「AI が推奨、人間が承認、システムが実行」のハイブリッドワークフロー
  • デスキリング問題に注意: AI 依存が進むと、稀にしか発生しない高度な障害への対応能力が失われる。「ネバースキリング」(新人が実践経験を積めない)はさらに深刻
  • 「障害対応100本ノック」はデスキリング対策そのもの: 意図的に AI 支援なしで訓練する機会を確保することが、長期的なスキル維持に不可欠
  • SRE が AI にもたらす価値は「コンテキスト」と「ガードレール」: AI が生成するコードが増えるほど、それを安全に動かすための SRE の仕事は増える
  • 事業成長へのコミットメントと運用力の掛け合わせが差別化要因: すてぃお氏の「技術力 × ビジネス力」に、プロダクション運用の専門性を加えることが、AI 時代のエンジニアの生存戦略

参考