Claude Managed Agents

概要 2026年4月8日に Anthropic がパブリックベータ公開した、AI エージェントの構築・デプロイ・運用に必要なインフラを一括提供する API スイート。開発者はモデル、システムプロンプト、ツール、MCP サーバーを定義するだけで、本番レベルのエージェントを稼働させられる。 主な機能 機能 説明 セキュアなサンドボックス エージェントの実行環境を安全に分離 長時間実行セッション 数時間にわたるタスクも途中状態を維持 永続的な状態管理 コンテキストウィンドウ外にセッションログを保持 マルチエージェント連携 複数エージェントのフリート管理 MCP 統合 HubSpot などの外部サービスと即座に連携可能 料金は API 従量課金に加えてセッション時間あたり $0.08。 アーキテクチャ:Brain / Session / Hands Claude Managed Agents は OS の抽象化パターンにならい、3つのコンポーネントを分離したメタハーネス設計を採用している。 Brain(ステートレスなハーネス + Claude) Agent Harness と Claude(LLM 推論)で構成 ステートレスなため、クラッシュしても wake(sessionId) で復旧可能 プロンプトキャッシュ、コンパクション、コンテキストエンジニアリングを担当 TTFT(最初のトークンまでの時間)を p50 で約60%、p95 で90%以上改善 Session(永続コンテキスト) コンテキストウィンドウの外に存在する append-only のイベントログ getEvents() インターフェースでイベントストリームの任意スライスを取得可能 長時間タスクでもコンテキストを回復可能な形で保存 Hands(使い捨て可能なサンドボックス + ツール) Brain から execute(name, input) → string で呼び出される統一インターフェース コンテナが落ちても Brain やセッションに波及しない障害分離 認証情報はサンドボックス内から到達不可能(プロンプトインジェクション対策) API の基本フロー 1 2 3 4 5 POST /v1/agents # Agent 定義 POST /v1/environments # コンテナテンプレート POST /v1/sessions # セッション開始 POST /v1/sessions/{id}/events # イベント送信 GET /v1/sessions/{id}/stream # SSE でレスポンス受信 ベータヘッダー managed-agents-2026-04-01 が必要。 ...

2026年4月14日 · 1 分

MemPalace

概要 2026年4月に GitHub で急速に注目を集めた AI メモリシステム。LongMemEval ベンチマークで 96.6% を公表し、1週間で 45,000 スター以上を獲得した。古代の記憶術「記憶の宮殿(Method of Loci)」にインスパイアされた階層構造で会話データを管理する。MIT ライセンスのオープンソース(Python)。 アーキテクチャ:宮殿の構造 階層 役割 Wing(翼) トピックやプロジェクトをグループ化 Hall(ホール) メモリの種類を分類 Room(部屋) 特定の知識やアイデアを保持 Closet / Drawer さらに細かい情報の格納 Tunnel(トンネル) 異なる Room 間の関連を結ぶナレッジグラフ 主な技術的特徴 完全ローカル動作: SQLite + ChromaDB でローカルに永続化、外部 API 不要 MCP 対応: Claude Code、ChatGPT、Cursor など主要 AI ツールと統合可能 AAAK 圧縮: 独自の省略圧縮方式(ただし有効時はスコアが低下、後述) ベンチマークと論争 公表された「96.6%」スコアは、MemPalace の宮殿構造ではなく ChromaDB のデフォルト埋め込み(all-MiniLM-L6-v2)による Recall@5 の数値であることが指摘されている。また 100% スコアはテストセットへのオーバーフィッティング、AAAK 圧縮を有効にするとスコアは 84.2% に低下するという問題が確認された。開発チームはこれらを認め README を修正している。 導入が有効なケース 記憶の仕組みを持たない AI ツールに永続メモリを追加したい場合 複数の AI ツール間でメモリを共有したい場合 既に Claude Code の auto-memory や CLAUDE.md / MEMORY.md を活用している場合は重複する可能性が高い。 ...

2026年4月14日 · 1 分

claude-mem

概要 thedotmack/claude-mem は Claude Code にセッションをまたいだ記憶を持たせる MCP(Model Context Protocol)ベースのオープンソースプラグイン。公開から48時間で46,000スターを獲得し、「トークン消費95%削減」「コンテキスト上限に到達しない」「前回の続きから再開できる」という特徴が開発者の注目を集めた。 主な特徴 特徴 内容 トークン削減 セッションあたり約95% ストレージ ローカル SQLite + Chroma インストール npx claude-mem install(1コマンド) ライセンス オープンソース・完全無料 3層検索フロー 関連する記憶を効率よく取り出すために、以下の段階的なフィルタリングを採用する: キーワード検索 (search) — テキストマッチで候補を絞り込む タイムライン確認 (timeline) — 時系列で文脈を絞り込む 詳細取得 (get_observations) — 必要な記憶だけを取得する 先に絞り込んでから詳細取得することで不要なトークン消費を防ぐ。この仕組みが「95%削減」の源泉。 記憶の保存と圧縮 Claude Code のセッション中の操作を自動キャプチャ AI を使って記憶を圧縮・要約(Claude Agent SDK を使用) ローカルの SQLite データベースに永続化 Chroma によるベクトル埋め込み検索で意味的に類似した記憶を検索 インストール 1 npx claude-mem install 特別な API キーや外部サービスの登録は不要。完全ローカルで動作する。 MemPalace との比較 観点 claude-mem MemPalace 対象 Claude Code 専用 複数 AI ツール対応 インストール 1コマンド Python セットアップ 公表スコア トークン95%削減 LongMemEval 96.6%(論争あり) アーキテクチャ 3層検索 宮殿構造(Wing/Hall/Room) 関連ページ MemPalace — 別アプローチの AI メモリシステム エージェントメモリのロックイン — メモリ管理の設計上の課題 Claude Code — claude-mem の動作環境 MCP — プラグインの接続プロトコル

2026年4月13日 · 1 分

MemPalace とは?LongMemEval 96.6%を記録したオープンソース AI メモリシステムの仕組みと論争

2026年4月、GitHub で爆発的に注目を集めた AI メモリシステム「MemPalace」。LongMemEval ベンチマークで 96.6% というスコアを叩き出し、わずか1週間で 45,000 スター以上を獲得した。女優ミラ・ジョヴォヴィッチと開発者 Ben Sigman による共同プロジェクトという異色の出自も話題を呼んだ。 本記事では、MemPalace の仕組み・特徴と、コミュニティから寄せられたベンチマーク手法への批判の両面を整理する。 MemPalace の概要 MemPalace は、LLM に永続的なクロスセッションメモリを提供するオープンソースシステムだ。 GitHub: milla-jovovich/mempalace ライセンス: MIT 言語: Python スター数: 45,000 以上(2026年4月時点) 古代の記憶術「記憶の宮殿(Method of Loci)」にインスパイアされた階層構造で、会話データを整理・保存する。 アーキテクチャ:宮殿の構造 MemPalace は会話データを以下の階層で管理する。 階層 役割 Wing(翼) トピックやプロジェクトをグループ化 Hall(ホール) メモリの種類を分類 Room(部屋) 特定の知識やアイデアを保持 Closet / Drawer(クローゼット / 引き出し) さらに細かい情報の格納 Tunnel(トンネル) 異なる Room 間の関連を結ぶナレッジグラフ この階層構造により、単純なベクトル検索とは異なる、構造化された記憶の管理を目指している。 主な技術的特徴 完全ローカル動作 SQLite + ChromaDB でローカルにデータを永続化 外部 API 呼び出し不要 データが端末から出ることがない MCP 対応 Claude Code、ChatGPT、Cursor など主要な AI ツールと MCP(Model Context Protocol)経由で統合可能。セットアップ後は、AI アシスタントが自動的に MemPalace のメモリにアクセスできる。 ...

2026年4月13日 · 2 分

Claude CodeからShopifyストアを直接操作できる「Shopify AI Toolkit」

Shopifyが「Shopify AI Toolkit」を公開した。Claude Code、Codex、Cursor、VS Codeなどのエージェント・IDE から直接 Shopify ストアを管理できる仕組みだ。 Shopify AI Toolkit とは Shopify AI Toolkit は、AI エージェントや開発ツールから Shopify バックエンドへ直接アクセスできるようにするツールキットだ。Model Context Protocol(MCP)をベースにしており、対応クライアントであれば Claude Code を含む主要エージェントから利用できる。 公式アナウンスでは以下の対応ツールが挙げられている: Claude Code OpenAI Codex Cursor VS Code その他 MCP 対応エージェント 主な機能 ツイートで紹介されている主要機能は以下のとおり: バックエンドへの直接書き込み: Claude Code などのエージェントから Shopify のバックエンド API へ直接書き込み操作が可能 1プロンプトで一括操作: 商品・注文・在庫・SEO・画像を単一のプロンプトで一括管理できる 16スキル搭載: 豊富な操作スキルが組み込み済み プラグイン経由で自動アップデート: プラグイン機構により機能が自動的に最新化される Claude Code での活用イメージ Claude Code から Shopify AI Toolkit を使うと、たとえば次のような操作がプロンプトひとつで実行できる: 新商品の登録(タイトル・説明・価格・在庫数の一括設定) SEO メタデータの一括最適化 特定カテゴリの商品価格を一括変更 注文ステータスの確認・更新 従来は Shopify 管理画面を手動で操作するか、独自スクリプトを書く必要があったこれらの作業が、自然言語の指示だけで完結する。 Shopify 制作への応用 チャエン氏(@masahirochaen)のツイートでは「Shopify制作代行で起業できる」と言及されており、EC サイト構築・運用における AI エージェント活用の可能性が広がっている。 ...

2026年4月12日 · 1 分

Rowboat:100%ローカルで動くオープンソースAI同僚ツール

完全オープンソースで動く AI 同僚ツール「Rowboat」が注目を集めている。音声制御、MCP ツール連携、バックグラウンドエージェントなど、有料 AI アシスタントサービスに相当する機能を、データをローカルに保ったまま利用できる点が特徴だ。 Rowboat とは Rowboat(rowboatlabs/rowboat)は「Open-source AI coworker, with memory」を謳う AI 同僚ツール。GitHub スター数は 12,000 以上(2026年4月時点)に達しており、急速に注目が高まっている。 主な特徴は以下の通り。 100% ローカル動作 — データが外部に出ない 音声制御 — リアルなアシスタントのように話しかけられる 任意の LLM に接続可能 — Claude、GPT-4 系などを選択できる MCP ツール + Obsidian ブレイン — ナレッジグラフと外部ツールを組み合わせた記憶管理 バックグラウンド自律エージェント — 裏側で自律的にタスクをこなすエージェント群 知識グラフの自動構築 — 会話・作業履歴から知識を蓄積 ローカルで動く AI 同僚のインパクト これまでの AI アシスタントの多くはクラウド型であり、プロンプト・ドキュメントなどのデータが外部サーバーに送信される仕組みだった。Rowboat はすべてローカルで処理するため、機密情報を扱う業務でも安心して利用できる。 また、任意の LLM を接続できる柔軟性も魅力だ。Anthropic の Claude を接続しながら推論はローカルで完結させるといった構成も可能で、API コストの制御がしやすい。 MCP ツール連携と Obsidian ブレイン Rowboat が対応している MCP(Model Context Protocol)は、AI ツールが外部サービスや情報源と標準化されたインターフェースで通信するためのプロトコルだ。これにより、ファイルシステム、Web 検索、カレンダーなど様々なツールをエージェントに組み込める。 ...

2026年4月12日 · 1 分

Claude Managed Agents のアーキテクチャ: Brain / Session / Hands の分離設計

前回の記事では Claude Managed Agents の概要と業界インパクトを紹介した。本記事では、Anthropic のエンジニアリングブログ「Scaling Managed Agents: Decoupling the brain from the hands」に基づき、内部アーキテクチャを掘り下げる。 全体アーキテクチャ Claude Managed Agents は4つのコアコンセプトで構成される。 コンセプト 説明 Agent モデル、システムプロンプト、ツール、MCP サーバー、スキルの定義 Environment コンテナテンプレート(パッケージ、ネットワークアクセス、マウントファイル) Session Agent と Environment を参照して起動される実行インスタンス Events アプリケーションとエージェント間でやり取りされるメッセージ(SSE) これらの背後には、Brain / Session / Hands という3層の分離設計がある。 設計思想: OS の抽象化パターン Anthropic はこのアーキテクチャの設計思想を、OS がハードウェアを抽象化した歴史に重ねている。 1970年代のディスクパックでも現代の SSD でも、read() コマンドは同じように動く。ハードウェアの実装が変わっても、その上の抽象化層(プロセス、ファイル)は安定し続けた。 Managed Agents も同じパターンを採用している。Session、Harness、Sandbox というエージェントのコンポーネントを仮想化し、インターフェースは安定させたまま、内部実装を自由に交換できる構造にした。Anthropic はこれを「メタハーネス」と呼んでいる。 なぜこの設計が必要なのか。ハーネスには「モデルが自力でできないこと」に関する前提が埋め込まれるが、モデルの能力が向上するとその前提が陳腐化する。例えば Claude Sonnet 4.5 では、コンテキスト制限が近づくとタスクを早期終了する「コンテキスト不安(context anxiety)」が見られた。そこでハーネスにコンテキストリセットを追加した。しかし Claude Opus 4.5 ではこの振る舞いが消え、リセット機能は無駄な荷物になった。 ...

2026年4月10日 · 3 分

Claude Managed Agents: Anthropicが本番運用可能なエージェント基盤をパブリックベータで公開

2026年4月8日、Anthropicが「Claude Managed Agents」をパブリックベータとして公開した。AIエージェントの本番運用に必要なインフラをすべてマネージドで提供するサービスで、エージェント構築のコストと期間を劇的に削減する。 Claude Managed Agents とは Claude Managed Agents は、AIエージェントの構築・デプロイ・運用に必要なインフラを一括提供する API スイートだ。開発者はモデル、システムプロンプト、ツール、MCP サーバーを定義するだけで、本番レベルのエージェントを稼働させられる。 提供される主な機能: セキュアなサンドボックス: エージェントの実行環境を安全に分離 長時間実行セッション: 数時間にわたるタスクも途中状態を維持しながら処理 状態管理: コンテキストウィンドウの外に永続的なセッションログを保持 マルチエージェント連携: 複数のエージェントが協調して動作するフリート管理 MCP 統合: HubSpot などの外部サービスと即座に連携可能 スコープ付き権限管理: エージェントごとに適切なアクセス制御を設定 platform.claude.com から利用でき、API 従量課金に加えてセッション時間あたり $0.08 の料金が発生する。 エージェント構築市場へのインパクト この発表が業界で大きな反響を呼んでいるのは、エージェント構築の構造そのものを変える可能性があるためだ。 開発期間の短縮 これまでエージェントを本番運用するには、サンドボックス、状態管理、認証、長時間実行、マルチエージェント協調といったインフラを自前で構築する必要があった。Claude Managed Agents はこれらをすべてマネージドで提供するため、月単位だった開発が日単位に短縮される。 既存プレイヤーへの影響 LangChain は Deep Research エージェントだけで1年かけて4つのアーキテクチャを開発してきた。Manus は6ヶ月で5回のハーネス書き直しを行った。Anthropic はこうした領域をファーストパーティのマネージドサービスとして一気に抽象化した形だ。「Claude を本番で安定稼働させる」ことを売りにしていたエージェントスタートアップにとっては、ビジネスモデルの根本的な見直しを迫られる状況と言える。 AWS のサーバーレス革命との類似 企業が求めているのは「エージェントのインフラを構築すること」ではなく「動くエージェント」そのものだ。AWS がサーバー管理を EC2 で抽象化したのと同じ構造で、Anthropic はエージェント構築という市場そのものを縮小させる可能性がある。 既に本番運用している企業 Anthropic の発表によると、Notion、Rakuten、Asana、Sentry がすでに Claude Managed Agents を本番環境で運用している。公式デモのダッシュボードでは、複数のエージェントがフリートとして稼働しタスクを処理している様子が確認できる。 OpenClaw 遮断との関連 発表の4日前、Anthropic は OpenClaw をはじめとするサードパーティ製ハーネスによるサブスクリプション認証情報の利用をブロックした。消費者向け認証レイヤーの上にサービスを構築することを止め、代わりにファーストパーティのマネージドプラットフォームを提供するという戦略が明確になった。 ...

2026年4月10日 · 1 分

バフェット・コード徹底分析 — EDINET XBRLを活用した企業分析SaaSの全貌

前回の記事で EDINET の XBRL データを Python で扱う方法を紹介した。今回は、その仕組みを活用して構築されている企業分析サービス「バフェット・コード」を分析し、何ができるのかを網羅的にまとめる。 バフェット・コードとは バフェット・コードは、EDINET(有価証券報告書)と TDNET(適時開示)の XBRL データをパースし、企業の財務情報をワンストップで分析できる SaaS サービスだ。バフェットコード株式会社が開発・運営している。 データパイプラインの流れは以下の通り: EDINET / TDNET から XBRL ファイルを取得 XBRL をパースして RDB に格納 過去データと株価を組み合わせて財務指標を算出 スクリーニング・比較用のデータセットを更新 このパイプラインの XBRL パース部分に、前回紹介した edinet_xbrl ライブラリが使われている。 Web アプリケーションでできること バフェット・コードの Web アプリ(buffett-code.com)では以下の機能が利用できる。 企業分析 財務データの閲覧: B/S(貸借対照表)、P/L(損益計算書)、C/S(キャッシュフロー計算書)を一覧表示 企業概況: 設立日、上場日、事業内容などの基本情報 役員一覧: 取締役・監査役の情報 大株主情報: 四半期ごとの大株主構成 セグメント情報: 事業セグメント別の業績データ 類似企業の表示: 同業他社の自動提案 スクリーニング・比較 条件検索: 財務指標(PER、PBR、ROE 等)でフィルタリング 企業比較: 複数企業の財務データを横並びで比較 株主検索: 特定の株主が保有する企業を検索 資料検索 横断検索: EDINET・TDNET の資料に加え、各社の決算説明資料や統合報告書も横断的に検索 CSV ダウンロード: 年間業績や各種指標のダウンロード Web API でできること バフェット・コードは REST API(v4)を提供しており、プログラムから財務データにアクセスできる。API の利用には有償契約が必要だが、テスト用 API キーも用意されている。 ...

2026年4月7日 · 2 分

Claude Code

概要 Anthropic が開発する CLI ベースの AI コーディングエージェント。ターミナル上で対話しながらコードの読み書き、ファイル操作、git 操作、テスト実行などを行える。 主な特徴 CLI ネイティブ: ターミナルで直接対話(IDE 拡張版も提供) ツール統合: ファイル読み書き、Bash 実行、Grep/Glob 検索、Web 検索等 CLAUDE.md: プロジェクトごとのルール・設定ファイル(圧縮後も再読み込みされる) サブエージェント: 複雑なタスクを並列エージェントに委任可能 スキル/フック: カスタムワークフローの定義と自動化 コンテキスト管理 5段階の圧縮カスケードでコンテキストウィンドウを管理する: Microcompact → Context Collapse → Session Memory → Full Compact → PTL Truncation 詳細: コンテキスト圧縮 LLM Wiki との関連 Karpathy は Claude Code を LLM Wiki の実行環境として使用。「左画面に Claude Code、右画面に Obsidian」というワークフローを実践。 思考深度のサイレント・ダウングレード問題 2026年4月、AMD のシニア AI ディレクターが約 6,852 セッション分のログ分析で発見した問題。2026年3月8日以降、Claude Code の思考の中央値が約 2,200 文字から約 600 文字(67%減)に低下していた。Anthropic は「アダプティブ・シンキング」による変更を認め、/effort max コマンドで高い思考深度を維持できると説明した。 ...

2026年4月6日 · 2 分