Claude Managed Agents: Anthropicが本番運用可能なエージェント基盤をパブリックベータで公開

2026年4月8日、Anthropicが「Claude Managed Agents」をパブリックベータとして公開した。AIエージェントの本番運用に必要なインフラをすべてマネージドで提供するサービスで、エージェント構築のコストと期間を劇的に削減する。 Claude Managed Agents とは Claude Managed Agents は、AIエージェントの構築・デプロイ・運用に必要なインフラを一括提供する API スイートだ。開発者はモデル、システムプロンプト、ツール、MCP サーバーを定義するだけで、本番レベルのエージェントを稼働させられる。 提供される主な機能: セキュアなサンドボックス: エージェントの実行環境を安全に分離 長時間実行セッション: 数時間にわたるタスクも途中状態を維持しながら処理 状態管理: コンテキストウィンドウの外に永続的なセッションログを保持 マルチエージェント連携: 複数のエージェントが協調して動作するフリート管理 MCP 統合: HubSpot などの外部サービスと即座に連携可能 スコープ付き権限管理: エージェントごとに適切なアクセス制御を設定 platform.claude.com から利用でき、API 従量課金に加えてセッション時間あたり $0.08 の料金が発生する。 エージェント構築市場へのインパクト この発表が業界で大きな反響を呼んでいるのは、エージェント構築の構造そのものを変える可能性があるためだ。 開発期間の短縮 これまでエージェントを本番運用するには、サンドボックス、状態管理、認証、長時間実行、マルチエージェント協調といったインフラを自前で構築する必要があった。Claude Managed Agents はこれらをすべてマネージドで提供するため、月単位だった開発が日単位に短縮される。 既存プレイヤーへの影響 LangChain は Deep Research エージェントだけで1年かけて4つのアーキテクチャを開発してきた。Manus は6ヶ月で5回のハーネス書き直しを行った。Anthropic はこうした領域をファーストパーティのマネージドサービスとして一気に抽象化した形だ。「Claude を本番で安定稼働させる」ことを売りにしていたエージェントスタートアップにとっては、ビジネスモデルの根本的な見直しを迫られる状況と言える。 AWS のサーバーレス革命との類似 企業が求めているのは「エージェントのインフラを構築すること」ではなく「動くエージェント」そのものだ。AWS がサーバー管理を EC2 で抽象化したのと同じ構造で、Anthropic はエージェント構築という市場そのものを縮小させる可能性がある。 既に本番運用している企業 Anthropic の発表によると、Notion、Rakuten、Asana、Sentry がすでに Claude Managed Agents を本番環境で運用している。公式デモのダッシュボードでは、複数のエージェントがフリートとして稼働しタスクを処理している様子が確認できる。 OpenClaw 遮断との関連 発表の4日前、Anthropic は OpenClaw をはじめとするサードパーティ製ハーネスによるサブスクリプション認証情報の利用をブロックした。消費者向け認証レイヤーの上にサービスを構築することを止め、代わりにファーストパーティのマネージドプラットフォームを提供するという戦略が明確になった。 ...

2026年4月10日 · 1 分

AI エージェント

概要 単一の応答ではなく、複数ステップのタスクを自律実行する AI システム。Claude Code、OpenAI Codex、Cursor など複数ツールで実装されている。エージェント間協調、分散実行、メモリ管理が 2026 年の主要トレンド。 主な実装パターン シングルエージェント: 1つの LLM が計画→実行→検証を繰り返す(Claude Code など) マルチエージェント: 複数のエージェントが役割分担して協調(Agent Teams) メタエージェント: エージェントのハーネスを AI 自身が改善(AutoAgent) 品質保証 AI エージェントの出力品質を担保するにはハーネスエンジニアリングが必須。CLAUDE.md(入力層)、Hooks(検証層)、Agent Skills(ワークフロー層)の多層構造で品質を保証する。 エージェント基盤の分類 2026年時点の主要なエージェント基盤は大きく3種類に分類できる。 種別 代表例 特徴 マネージドクラウド型 Claude Managed Agents インフラ不要、スケーラブル、ベンダー依存 ローカル自律型 OpenClaw プライバシー重視、カスタマイズ自由、セルフホスト クラウド連携型 Gemini Agent 特定サービス(Google Workspace 等)に最適化 ハーネスとメモリのロックイン LangChain 創設者 Harrison Chase が指摘する重要な概念。エージェントのメモリ(長期記憶)はハーネスの設計と不可分であり、クローズドなハーネスを使うと以下のリスクが生じる: コンパクション(会話圧縮)のロジックが不透明になる 長期メモリが第三者のサーバーに保存される ハーネス移行時にメモリの移植が困難になる 関連ページ Claude Code — 代表的な AI コーディングエージェント Claude Managed Agents — Anthropic のマネージドエージェント基盤 Gemini Agent — Google Workspace 連携エージェント OpenClaw — ローカル自律型エージェント ハーネスエンジニアリング — エージェント品質保証の設計パターン 自己改善エージェント — エージェントが自律的に改善するパターン MCP — エージェントと外部ツールの接続プロトコル ソース記事 AI エージェント QA 手法 — 2026-03 Claude Code Agent Teams — 2026-03 AutoAgent — 2026-04 Gemini Agentモード:Google Workspaceを自動化するAIエージェント — 2026-04-07 Claude Managed Agents: パブリックベータ公開 — 2026-04-10 Claude Managed Agents のアーキテクチャ — 2026-04-10 Anthropic vs OpenAI:Harness 戦略はなぜ真逆なのか — 2026-04-13 エージェントハーネスとメモリのロックイン問題 — 2026-04-12

2026年4月6日 · 1 分

AutoAgent

概要 Kevin Gu 氏(Third Layer CTO)が開発した Python 製 OSS ライブラリ。メタエージェントとタスクエージェントの二重構造で、エージェントのハーネス(プロンプト・ツール・オーケストレーション)を自律的に最適化する。24時間の自律最適化で SpreadsheetBench・TerminalBench 世界1位を達成。 基本情報 GitHub: kevinrgu/autoagent ライセンス: MIT 言語: Python 依存: Docker, Python 3.10+, uv ベンチマーク ベンチマーク スコア 順位 SpreadsheetBench 96.5% 1位 TerminalBench(GPT-5スコア) 55.1% 1位 プロジェクト構成 agent.py -- ハーネス本体(メタエージェントの編集対象) program.md -- メタエージェントへの方針指示(人間が編集) tasks/ -- 評価タスク(Harbor フォーマット) 人間は program.md にゴールを書き、agent.py の改善はメタエージェントに任せる。 関連ページ 自己改善エージェント — AutoAgent が実装するパターン Claude Code — メタエージェントの実行環境として利用可能 ソース記事 AutoAgent — AIがAIを育てる自己改善エージェントOSSライブラリ — 2026-04-05

2026年4月6日 · 1 分

MCP (Model Context Protocol)

概要 Anthropic が主導する、AI モデルと外部システムの連携のためのオープンプロトコル。Claude Code、Cursor など主要 AI ツールで採用が進み、AWS、GitHub、Google Workspace など主要プラットフォームが MCP Server を公開。 特徴 ベンダーロックインを避けた相互運用性 ツール定義の標準化(JSON Schema ベース) サブミリ秒レイテンシでの動作 関連ページ AI エージェント — MCP を利用してツール連携するシステム Claude Code — MCP の主要クライアント実装 ソース記事 SD 2026年4月号 — 2026-03

2026年4月6日 · 1 分

OpenClaw

概要 深圳で開発されたオープンソース AI エージェント基盤。2025年11月に「Clawdbot」として公開後、商標問題で改名。複数の LLM(Claude、Grok、Ollama)に対応し、MCP 統合により任意のツール連携が可能。GitHub スターは25万を超える。 設計思想:ローカル自律型 OpenClaw は Gateway デーモンがユーザーのデバイスに常駐し、自律的にタスクを処理する設計。Claude Managed Agents(クラウド管理型)とは対照的なアーキテクチャを持つ。 観点 OpenClaw Claude Managed Agents 実行場所 ローカルデバイス Anthropic クラウド 常駐性 Gateway デーモンが常駐 セッション単位のオンデマンド データ管理 SOUL.md / MEMORY.md でローカル管理 Anthropic サーバーに保存 カスタマイズ ClawHub の 13,000+ スキル MCP サーバー + 組み込みツール 障害分離 単一デーモン(Gateway + Runtime 結合) Brain / Session / Hands が独立 Gemini Agent との比較 Google Gemini Agent モード(クラウド型、Google Workspace 専用)との対比: Gemini Agent: クラウド管理、Google Workspace との統合が強み、スケジュール実行可能 OpenClaw: セルフホスト、データがデバイスから出ない、100以上のビルトインスキル セキュリティ上の注意 中国 CNCERT が緊急セキュリティ警告を発出。デフォルト設定でローカルファイルシステム・環境変数・シェルへの広範なアクセスが有効になっている問題。コンテナ隔離、ネットワーク制限が必須。また、Cisco・Giskard の研究チームがサードパーティスキルにおけるデータ流出・プロンプトインジェクションリスクを指摘(CVE-2026-25253、CVSS 8.8)。 ...

2026年4月6日 · 1 分

ハーネスエンジニアリング

概要 AI エージェント全盛時代に必須の設計手法。CLAUDE.md(入力層)、MEMORY.md(実行記録層)、Hooks(検証層)、Agent Skills(ワークフロー層)の4層で AI 出力の品質を決定論的に保証する。Anthropic 公式の推奨パターン。 4層構造 層 役割 実装 入力層 AI への指示・制約 CLAUDE.md 記録層 学習・実行履歴 MEMORY.md 検証層 出力の事前/事後チェック Hooks (PreToolUse/PostToolUse) ワークフロー層 構造化タスク定義 Agent Skills (SKILL.md) Anthropic vs OpenAI のハーネス戦略 両社はともにハーネスの重要性を認識しているが、アプローチが対照的だ。 観点 OpenAI Anthropic ハーネスの位置づけ エンジニアが設計する環境(Harness Engineering) プラットフォームが提供する基盤(Managed Agent) 人間の役割 プロジェクトマネージャー AI との協働者 製品 Codex + Symphony Claude Code + Managed Agent OpenAI は AI がソフトウェア開発を全面的に担う方向を目指し、Anthropic はエージェント実行基盤を「Agent OS」としてプラットフォーム化している。 ハーネスとメモリのロックイン LangChain 創設者 Harrison Chase が指摘する通り、ハーネスとメモリは不可分だ。メモリはコンテキストの一形態であり、ハーネスの中核的な責任。クローズドなハーネスを使うことは、以下の4層すべての管理を第三者に委ねることを意味する: コンテキストウィンドウ内のメッセージ履歴 — 構成方法でモデルの応答が変わる コンパクション(会話の要約圧縮) — 何を残し何を捨てるかでエージェントの「記憶の質」が変わる 永続ファイル・データベース(長期メモリ) — エージェントの「人格」を形成する 設定・スキルのロード方式 — エージェントの能力を規定する ハーネスの「内側」と「外側」の混乱 「ハーネス」という言葉は話者のポジションによって意味がズレる(watany 氏, 2026年4月): ...

2026年4月6日 · 2 分

自己改善エージェント

概要 AI エージェントの構成一式(ハーネス: システムプロンプト・ツール・オーケストレーション)を、AI 自身が自律的に改善するパターン。人間はゴール(成功の定義)だけを与え、最適化はメタエージェントに任せる。 メタエージェントとタスクエージェント 役割 担当 メタエージェント(コーチ) 失敗トレースを分析し、ハーネスを書き換える タスクエージェント(選手) メタエージェントが設計したハーネスで実タスクを実行 最適化ループ メタエージェントがハーネスを書き換える タスクエージェントがタスクを実行する スコアを測定する 失敗トレースを分析する 改善なら採用、悪化なら元に戻す(繰り返し) モデル共感(Model Empathy) 同じモデル同士でペアリングすると、コーチは選手の失敗パターンを「自分ごと」として理解できる。同じ重みを共有しているため推論過程を正確に把握でき、異なるモデルの組み合わせより高い性能を示す。 創発的な改善行動 設計者が意図しなかった行動が自然に出現する: スポットチェック(小さな編集の高速検証) 強制検証ループ(自己修正ターンのバジェット組み込み) 自前テスト作成(ユニットテストの自律生成) サブエージェント生成(ドメイン別の役割分担) 関連ページ AutoAgent — このパターンを実装した OSS ライブラリ LLM Wiki パターン — AI による知識保守という関連パターン ソース記事 AutoAgent — AIがAIを育てる自己改善エージェントOSSライブラリ — 2026-04-05

2026年4月6日 · 1 分

AutoAgent — AIがAIを育てる自己改善エージェントOSSライブラリ

AIエージェントの性能を左右する「ハーネス」を、AI自身が自律的に改善するOSSライブラリ AutoAgent が公開されました。ハーネスとは、システムプロンプト・ツール・オーケストレーションから成るエージェントの構成一式のことです。24時間の自律最適化だけで、SpreadsheetBench と TerminalBench の2つのベンチマークで世界1位を達成しています。 AutoAgent とは AutoAgent は Kevin Gu 氏(Third Layer CTO)が開発したPython製OSSライブラリで、「AIがAIを育てる」仕組みを提供します。 従来、AIエージェントを実用レベルにするには、システムプロンプトの調整、ツールの追加、実行フローの設計といった「ハーネス設計」が不可欠でした。この作業は専門知識を要し、1つのハーネスに何日もかかることがあります。AutoAgent はこのハーネス設計をAI自身に任せることで、人間の手動チューニングを超える精度を実現しました。 GitHub: kevinrgu/autoagent ライセンス: MIT 言語: Python ベンチマーク結果 ベンチマーク スコア 順位 SpreadsheetBench 96.5% 1位 TerminalBench(GPT-5スコア) 55.1% 1位 他のエントリーはすべて人間が手動チューニングしたものです。AutoAgentだけが自律的にこのスコアに到達しました。 仕組み: メタエージェントとタスクエージェント AutoAgent は2つのAIの役割分担で動作します。 メタエージェント(コーチ役) ハーネスを改良することが仕事。タスクエージェントの失敗トレースを読み、プロンプト・ツール・オーケストレーションを書き換えます。 タスクエージェント(選手役) 実際のタスクをこなすことが仕事。メタエージェントが設計したハーネスに従って作業を実行します。 最適化ループ 人間がやることは、AutoAgent の設定ファイル program.md にゴール(成功の定義)を書くだけです。あとはAIが24時間、以下のループを回します: メタエージェントがハーネスを書き換える タスクエージェントがタスクを実行する スコアを測定する 失敗トレースを分析し「なぜ失敗したか」を特定する 改善なら採用、悪化なら元に戻す 1に戻る これを数千の並列サンドボックス(隔離された実行環境)で同時実行します。 なぜAIのほうが上手く改善できるのか — 「モデル共感」 人間はどうしても自分の感覚でAIを設計してしまいます。しかし、AIは人間とは異なる思考回路で動いています。 同じモデル同士(例: Claude × Claude)でペアリングすると、コーチ(メタエージェント)は選手(タスクエージェント)の「失敗パターン」を自分ごととして理解できます。同じ重みを共有しているため、内側のモデルがどう推論するかを正確に把握できるのです。 AutoAgent の開発チームはこれを 「モデル共感(model empathy)」 と呼んでいます。実際に、Claude メタエージェント + Claude タスクエージェントの組み合わせは、Claude メタエージェント + GPT タスクエージェントの組み合わせよりも高い性能を示しました。 ...

2026年4月5日 · 2 分

claw-code-local — Claude Code風のAIコーディングエージェントをローカルLLMで動かす

Claude Code ライクなターミナル AI コーディングエージェントを、Anthropic API なしでローカル LLM で動かせる「claw-code-local」が登場しました。Rust で実装された軽量・高速なツールで、Ollama や LM Studio など好みの LLM バックエンドを自由に選べます。 claw-code-local とは claw-code-local は、Claude Code のアーキテクチャをクリーンルーム方式(既存コードを参照せず仕様から独自に再実装する手法)で作られた「Claw Code」のフォークです。ローカル LLM や任意の OpenAI 互換エンドポイントに接続できるよう拡張されています。 オリジナルの Claw Code は Rust で書かれたマルチプロバイダー API レイヤーを持っていましたが、実際のバイナリにはその機能が組み込まれていませんでした。claw-code-local はこの部分を修正し、Ollama、LM Studio、OpenAI、xAI など様々なプロバイダーに接続できるようにしています。 主な特徴 ローカル LLM 対応: Ollama、LM Studio、その他 OpenAI 互換エンドポイントで動作 Rust 実装: 軽量・高速なバイナリ マルチプラットフォーム: Windows、Linux、macOS に対応 コストゼロ: ローカル LLM を使えば API 費用が不要 プライバシー保護: コードが外部サーバーに送信されないため、機密情報の漏洩リスクを低減 セットアップ手順 1. リポジトリのクローンとビルド 1 2 3 git clone https://github.com/codetwentyfive/claw-code-local.git cd claw-code-local/rust cargo build -p rusty-claude-cli --release ビルド後のバイナリは以下に生成されます: ...

2026年4月5日 · 2 分

Anthropic Conway

概要 Anthropic が内部テスト中の常駐型 AI エージェント環境(コードネーム「Conway」)。2026年4月に TestingCatalog がリーク報道で存在を確認した。従来の Claude Desktop / Claude Code が「ユーザーの入力をトリガーとするワンショット型」であるのに対し、Conway は 24 時間バックグラウンドで稼働し続け、外部イベントやスケジュールを起点に自律的にタスクを実行する。 主な特徴 機能 説明 Always-On(常時稼働) ユーザーが不在でもバックグラウンドで継続動作 Webhook 連携 外部サービスからのイベントをトリガーに自動実行 ブラウザ操作 Chrome を通じた Web 上のマルチステップ処理 Claude Code 連携 コーディングタスクの自動化(コードネーム “Epitaxy”) .cnw 拡張機構 .cnw.zip 形式のカスタムツール・UI タブ・コンテキストハンドラ 通知システム タスク完了などのイベント通知 Anthropic エージェント製品との対比 製品 起動方式 主な用途 Claude Desktop ユーザープロンプト 対話型チャット Claude Code ユーザー指示 CLI コーディング支援 Cowork 非同期タスク クラウド上の自律タスク Conway 外部イベント / スケジュール 常駐型自律エージェント 想定ユースケース メール受信時に自動で要約・分類 GitHub Issue 作成をトリガーにした調査・対応 Slack メンション通知への自動応答 定期的なデータ収集・レポート生成 現状 2026年4月時点では Anthropic 内部テスト段階。公式アナウンスは未実施。 ...

2026年4月3日 · 1 分