概要

AI エージェント全盛時代に必須の設計手法。CLAUDE.md(入力層)、MEMORY.md(実行記録層)、Hooks(検証層)、Agent Skills(ワークフロー層)の4層で AI 出力の品質を決定論的に保証する。Anthropic 公式の推奨パターン。

4層構造

役割実装
入力層AI への指示・制約CLAUDE.md
記録層学習・実行履歴MEMORY.md
検証層出力の事前/事後チェックHooks (PreToolUse/PostToolUse)
ワークフロー層構造化タスク定義Agent Skills (SKILL.md)

Anthropic vs OpenAI のハーネス戦略

両社はともにハーネスの重要性を認識しているが、アプローチが対照的だ。

観点OpenAIAnthropic
ハーネスの位置づけエンジニアが設計する環境(Harness Engineering)プラットフォームが提供する基盤(Managed Agent)
人間の役割プロジェクトマネージャーAI との協働者
製品Codex + SymphonyClaude Code + Managed Agent

OpenAI は AI がソフトウェア開発を全面的に担う方向を目指し、Anthropic はエージェント実行基盤を「Agent OS」としてプラットフォーム化している。

ハーネスとメモリのロックイン

LangChain 創設者 Harrison Chase が指摘する通り、ハーネスとメモリは不可分だ。メモリはコンテキストの一形態であり、ハーネスの中核的な責任。クローズドなハーネスを使うことは、以下の4層すべての管理を第三者に委ねることを意味する:

  1. コンテキストウィンドウ内のメッセージ履歴 — 構成方法でモデルの応答が変わる
  2. コンパクション(会話の要約圧縮) — 何を残し何を捨てるかでエージェントの「記憶の質」が変わる
  3. 永続ファイル・データベース(長期メモリ) — エージェントの「人格」を形成する
  4. 設定・スキルのロード方式 — エージェントの能力を規定する

ハーネスの「内側」と「外側」の混乱

「ハーネス」という言葉は話者のポジションによって意味がズレる(watany 氏, 2026年4月):

視点定義文脈
内側のハーネスモデル呼び出し間でコンテキストを引き継ぐ機構(LangChain / Anthropic)プラットフォーム・フレームワーク側
外側のハーネスエージェントが同じミスを繰り返さないように設計する実践(Mitchell Hashimoto / OpenAI)ユーザー・実践者側

Claude Harness v4.0.0 “Hokage” — Go ネイティブ化

Claude Code のハーネスエンジニアリングを 1 パッケージで組み込んだ外装プラグイン「Claude Harness」が v4.0.0 “Hokage” をリリース(2026-04-14)。

改善点BeforeAfter
フック実行速度~300ms(bash → Node.js → TypeScript 3段ロケット)~10ms(Go バイナリ 1 本、30 倍速)
設定ファイル数5〜6 本を手動整合(plugin.json / hooks.json / settings.json 等)harness.toml 1 本(SSOT)
ガードレールR12 warnR12 deny + Bash bypass 二重防御
Node.js 依存必要不要(ネイティブバイナリ 3 本)

pure-Go SQLite(modernc.org/sqlite)採用で Node.js ランタイム要件を完全排除。bin/harness syncplugin.json / hooks.json / settings.json が全て整合される。

AI ファースト運用の実績(CreaoAI, 25 名)

CreaoAI は「AIファーストハーネスエンジニアリング」を実践し、6 週間のリリースサイクルを 1 日に短縮した:

  • コードの 99% を AI が生成
  • 1 日 8 回デプロイ(14 日間平均 3〜8 回/日)
  • モノレポへの統合(AI が全体を把握できるようにするため)
  • 3 つの並列 Claude レビューパス(コード品質・セキュリティ・依存関係スキャン)

解消した 3 つのボトルネック: PM の計画サイクル、QA のテスト時間、ヘッドカウント不足。

RAG なしで高精度になる理由

コンテキストウィンドウの拡大(20k〜1M トークン)により、100 ファイル以下のコードベースはハーネスがファイルをそのまま読み込める。RAG の「断片的コンテキスト問題」を回避できるため、より正確な依存関係・型・インターフェースを参照できる。100 ファイルを超える場合は GraphRAG 等のインデックス戦略が有効。

関連ページ

ソース記事