MCP | hdknr blog

Claude Managed Agents

概要 2026年4月8日に Anthropic がパブリックベータ公開した、AI エージェントの構築・デプロイ・運用に必要なインフラを一括提供する API スイート。開発者はモデル、システムプロンプト、ツール、MCP サーバーを定義するだけで、本番レベルのエージェントを稼働させられる。主な機能機能説明セキュアなサンドボックスエージェントの実行環境を安全に分離長時間実行セッション数時間にわたるタスクも途中状態を維持永続的な状態管理コンテキストウィンドウ外にセッションログを保持マルチエージェント連携複数エージェントのフリート管理 MCP 統合 HubSpot などの外部サービスと即座に連携可能料金は API 従量課金に加えてセッション時間あたり $0.08。アーキテクチャ：Brain / Session / Hands Claude Managed Agents は OS の抽象化パターンにならい、3つのコンポーネントを分離したメタハーネス設計を採用している。 Brain（ステートレスなハーネス + Claude） Agent Harness と Claude（LLM 推論）で構成ステートレスなため、クラッシュしても wake(sessionId) で復旧可能プロンプトキャッシュ、コンパクション、コンテキストエンジニアリングを担当 TTFT（最初のトークンまでの時間）を p50 で約60%、p95 で90%以上改善 Session（永続コンテキスト）コンテキストウィンドウの外に存在する append-only のイベントログ getEvents() インターフェースでイベントストリームの任意スライスを取得可能長時間タスクでもコンテキストを回復可能な形で保存 Hands（使い捨て可能なサンドボックス + ツール） Brain から execute(name, input) → string で呼び出される統一インターフェースコンテナが落ちても Brain やセッションに波及しない障害分離認証情報はサンドボックス内から到達不可能（プロンプトインジェクション対策） API の基本フロー 1 2 3 4 5 POST /v1/agents # Agent 定義 POST /v1/environments # コンテナテンプレート POST /v1/sessions # セッション開始 POST /v1/sessions/{id}/events # イベント送信 GET /v1/sessions/{id}/stream # SSE でレスポンス受信ベータヘッダー managed-agents-2026-04-01 が必要。 ...

MemPalace

概要 2026年4月に GitHub で急速に注目を集めた AI メモリシステム。LongMemEval ベンチマークで 96.6% を公表し、1週間で 45,000 スター以上を獲得した。古代の記憶術「記憶の宮殿（Method of Loci）」にインスパイアされた階層構造で会話データを管理する。MIT ライセンスのオープンソース（Python）。アーキテクチャ：宮殿の構造階層役割 Wing（翼）トピックやプロジェクトをグループ化 Hall（ホール）メモリの種類を分類 Room（部屋）特定の知識やアイデアを保持 Closet / Drawer さらに細かい情報の格納 Tunnel（トンネル）異なる Room 間の関連を結ぶナレッジグラフ主な技術的特徴完全ローカル動作: SQLite + ChromaDB でローカルに永続化、外部 API 不要 MCP 対応: Claude Code、ChatGPT、Cursor など主要 AI ツールと統合可能 AAAK 圧縮: 独自の省略圧縮方式（ただし有効時はスコアが低下、後述）ベンチマークと論争公表された「96.6%」スコアは、MemPalace の宮殿構造ではなく ChromaDB のデフォルト埋め込み（all-MiniLM-L6-v2）による Recall@5 の数値であることが指摘されている。また 100% スコアはテストセットへのオーバーフィッティング、AAAK 圧縮を有効にするとスコアは 84.2% に低下するという問題が確認された。開発チームはこれらを認め README を修正している。導入が有効なケース記憶の仕組みを持たない AI ツールに永続メモリを追加したい場合複数の AI ツール間でメモリを共有したい場合既に Claude Code の auto-memory や CLAUDE.md / MEMORY.md を活用している場合は重複する可能性が高い。 ...

claude-mem

概要 thedotmack/claude-mem は Claude Code にセッションをまたいだ記憶を持たせる MCP（Model Context Protocol）ベースのオープンソースプラグイン。公開から48時間で46,000スターを獲得し、「トークン消費95%削減」「コンテキスト上限に到達しない」「前回の続きから再開できる」という特徴が開発者の注目を集めた。主な特徴特徴内容トークン削減セッションあたり約95% ストレージローカル SQLite + Chroma インストール npx claude-mem install（1コマンド）ライセンスオープンソース・完全無料 3層検索フロー関連する記憶を効率よく取り出すために、以下の段階的なフィルタリングを採用する: キーワード検索 (search) — テキストマッチで候補を絞り込むタイムライン確認 (timeline) — 時系列で文脈を絞り込む詳細取得 (get_observations) — 必要な記憶だけを取得する先に絞り込んでから詳細取得することで不要なトークン消費を防ぐ。この仕組みが「95%削減」の源泉。記憶の保存と圧縮 Claude Code のセッション中の操作を自動キャプチャ AI を使って記憶を圧縮・要約（Claude Agent SDK を使用）ローカルの SQLite データベースに永続化 Chroma によるベクトル埋め込み検索で意味的に類似した記憶を検索インストール 1 npx claude-mem install 特別な API キーや外部サービスの登録は不要。完全ローカルで動作する。 MemPalace との比較観点 claude-mem MemPalace 対象 Claude Code 専用複数 AI ツール対応インストール 1コマンド Python セットアップ公表スコアトークン95%削減 LongMemEval 96.6%（論争あり）アーキテクチャ 3層検索宮殿構造（Wing/Hall/Room）関連ページ MemPalace — 別アプローチの AI メモリシステムエージェントメモリのロックイン — メモリ管理の設計上の課題 Claude Code — claude-mem の動作環境 MCP — プラグインの接続プロトコル

MemPalace とは？LongMemEval 96.6%を記録したオープンソース AI メモリシステムの仕組みと論争

2026年4月、GitHub で爆発的に注目を集めた AI メモリシステム「MemPalace」。LongMemEval ベンチマークで 96.6% というスコアを叩き出し、わずか1週間で 45,000 スター以上を獲得した。女優ミラ・ジョヴォヴィッチと開発者 Ben Sigman による共同プロジェクトという異色の出自も話題を呼んだ。本記事では、MemPalace の仕組み・特徴と、コミュニティから寄せられたベンチマーク手法への批判の両面を整理する。 MemPalace の概要 MemPalace は、LLM に永続的なクロスセッションメモリを提供するオープンソースシステムだ。 GitHub: milla-jovovich/mempalace ライセンス: MIT 言語: Python スター数: 45,000 以上（2026年4月時点）古代の記憶術「記憶の宮殿（Method of Loci）」にインスパイアされた階層構造で、会話データを整理・保存する。アーキテクチャ：宮殿の構造 MemPalace は会話データを以下の階層で管理する。階層役割 Wing（翼）トピックやプロジェクトをグループ化 Hall（ホール）メモリの種類を分類 Room（部屋）特定の知識やアイデアを保持 Closet / Drawer（クローゼット / 引き出し）さらに細かい情報の格納 Tunnel（トンネル）異なる Room 間の関連を結ぶナレッジグラフこの階層構造により、単純なベクトル検索とは異なる、構造化された記憶の管理を目指している。主な技術的特徴完全ローカル動作 SQLite + ChromaDB でローカルにデータを永続化外部 API 呼び出し不要データが端末から出ることがない MCP 対応 Claude Code、ChatGPT、Cursor など主要な AI ツールと MCP（Model Context Protocol）経由で統合可能。セットアップ後は、AI アシスタントが自動的に MemPalace のメモリにアクセスできる。 ...

Claude CodeからShopifyストアを直接操作できる「Shopify AI Toolkit」

Shopifyが「Shopify AI Toolkit」を公開した。Claude Code、Codex、Cursor、VS Codeなどのエージェント・IDE から直接 Shopify ストアを管理できる仕組みだ。 Shopify AI Toolkit とは Shopify AI Toolkit は、AI エージェントや開発ツールから Shopify バックエンドへ直接アクセスできるようにするツールキットだ。Model Context Protocol（MCP）をベースにしており、対応クライアントであれば Claude Code を含む主要エージェントから利用できる。公式アナウンスでは以下の対応ツールが挙げられている: Claude Code OpenAI Codex Cursor VS Code その他 MCP 対応エージェント主な機能ツイートで紹介されている主要機能は以下のとおり: バックエンドへの直接書き込み: Claude Code などのエージェントから Shopify のバックエンド API へ直接書き込み操作が可能 1プロンプトで一括操作: 商品・注文・在庫・SEO・画像を単一のプロンプトで一括管理できる 16スキル搭載: 豊富な操作スキルが組み込み済みプラグイン経由で自動アップデート: プラグイン機構により機能が自動的に最新化される Claude Code での活用イメージ Claude Code から Shopify AI Toolkit を使うと、たとえば次のような操作がプロンプトひとつで実行できる: 新商品の登録（タイトル・説明・価格・在庫数の一括設定） SEO メタデータの一括最適化特定カテゴリの商品価格を一括変更注文ステータスの確認・更新従来は Shopify 管理画面を手動で操作するか、独自スクリプトを書く必要があったこれらの作業が、自然言語の指示だけで完結する。 Shopify 制作への応用チャエン氏（@masahirochaen）のツイートでは「Shopify制作代行で起業できる」と言及されており、EC サイト構築・運用における AI エージェント活用の可能性が広がっている。 ...

Rowboat：100%ローカルで動くオープンソースAI同僚ツール

完全オープンソースで動く AI 同僚ツール「Rowboat」が注目を集めている。音声制御、MCP ツール連携、バックグラウンドエージェントなど、有料 AI アシスタントサービスに相当する機能を、データをローカルに保ったまま利用できる点が特徴だ。 Rowboat とは Rowboat（rowboatlabs/rowboat）は「Open-source AI coworker, with memory」を謳う AI 同僚ツール。GitHub スター数は 12,000 以上（2026年4月時点）に達しており、急速に注目が高まっている。主な特徴は以下の通り。 100% ローカル動作 — データが外部に出ない音声制御 — リアルなアシスタントのように話しかけられる任意の LLM に接続可能 — Claude、GPT-4 系などを選択できる MCP ツール + Obsidian ブレイン — ナレッジグラフと外部ツールを組み合わせた記憶管理バックグラウンド自律エージェント — 裏側で自律的にタスクをこなすエージェント群知識グラフの自動構築 — 会話・作業履歴から知識を蓄積ローカルで動く AI 同僚のインパクトこれまでの AI アシスタントの多くはクラウド型であり、プロンプト・ドキュメントなどのデータが外部サーバーに送信される仕組みだった。Rowboat はすべてローカルで処理するため、機密情報を扱う業務でも安心して利用できる。また、任意の LLM を接続できる柔軟性も魅力だ。Anthropic の Claude を接続しながら推論はローカルで完結させるといった構成も可能で、API コストの制御がしやすい。 MCP ツール連携と Obsidian ブレイン Rowboat が対応している MCP（Model Context Protocol）は、AI ツールが外部サービスや情報源と標準化されたインターフェースで通信するためのプロトコルだ。これにより、ファイルシステム、Web 検索、カレンダーなど様々なツールをエージェントに組み込める。 ...

Claude Managed Agents のアーキテクチャ: Brain / Session / Hands の分離設計

前回の記事では Claude Managed Agents の概要と業界インパクトを紹介した。本記事では、Anthropic のエンジニアリングブログ「Scaling Managed Agents: Decoupling the brain from the hands」に基づき、内部アーキテクチャを掘り下げる。全体アーキテクチャ Claude Managed Agents は4つのコアコンセプトで構成される。コンセプト説明 Agent モデル、システムプロンプト、ツール、MCP サーバー、スキルの定義 Environment コンテナテンプレート（パッケージ、ネットワークアクセス、マウントファイル） Session Agent と Environment を参照して起動される実行インスタンス Events アプリケーションとエージェント間でやり取りされるメッセージ（SSE）これらの背後には、Brain / Session / Hands という3層の分離設計がある。設計思想: OS の抽象化パターン Anthropic はこのアーキテクチャの設計思想を、OS がハードウェアを抽象化した歴史に重ねている。 1970年代のディスクパックでも現代の SSD でも、read() コマンドは同じように動く。ハードウェアの実装が変わっても、その上の抽象化層（プロセス、ファイル）は安定し続けた。 Managed Agents も同じパターンを採用している。Session、Harness、Sandbox というエージェントのコンポーネントを仮想化し、インターフェースは安定させたまま、内部実装を自由に交換できる構造にした。Anthropic はこれを「メタハーネス」と呼んでいる。なぜこの設計が必要なのか。ハーネスには「モデルが自力でできないこと」に関する前提が埋め込まれるが、モデルの能力が向上するとその前提が陳腐化する。例えば Claude Sonnet 4.5 では、コンテキスト制限が近づくとタスクを早期終了する「コンテキスト不安（context anxiety）」が見られた。そこでハーネスにコンテキストリセットを追加した。しかし Claude Opus 4.5 ではこの振る舞いが消え、リセット機能は無駄な荷物になった。 ...

Claude Managed Agents: Anthropicが本番運用可能なエージェント基盤をパブリックベータで公開

2026年4月8日、Anthropicが「Claude Managed Agents」をパブリックベータとして公開した。AIエージェントの本番運用に必要なインフラをすべてマネージドで提供するサービスで、エージェント構築のコストと期間を劇的に削減する。 Claude Managed Agents とは Claude Managed Agents は、AIエージェントの構築・デプロイ・運用に必要なインフラを一括提供する API スイートだ。開発者はモデル、システムプロンプト、ツール、MCP サーバーを定義するだけで、本番レベルのエージェントを稼働させられる。提供される主な機能: セキュアなサンドボックス: エージェントの実行環境を安全に分離長時間実行セッション: 数時間にわたるタスクも途中状態を維持しながら処理状態管理: コンテキストウィンドウの外に永続的なセッションログを保持マルチエージェント連携: 複数のエージェントが協調して動作するフリート管理 MCP 統合: HubSpot などの外部サービスと即座に連携可能スコープ付き権限管理: エージェントごとに適切なアクセス制御を設定 platform.claude.com から利用でき、API 従量課金に加えてセッション時間あたり $0.08 の料金が発生する。エージェント構築市場へのインパクトこの発表が業界で大きな反響を呼んでいるのは、エージェント構築の構造そのものを変える可能性があるためだ。開発期間の短縮これまでエージェントを本番運用するには、サンドボックス、状態管理、認証、長時間実行、マルチエージェント協調といったインフラを自前で構築する必要があった。Claude Managed Agents はこれらをすべてマネージドで提供するため、月単位だった開発が日単位に短縮される。既存プレイヤーへの影響 LangChain は Deep Research エージェントだけで1年かけて4つのアーキテクチャを開発してきた。Manus は6ヶ月で5回のハーネス書き直しを行った。Anthropic はこうした領域をファーストパーティのマネージドサービスとして一気に抽象化した形だ。「Claude を本番で安定稼働させる」ことを売りにしていたエージェントスタートアップにとっては、ビジネスモデルの根本的な見直しを迫られる状況と言える。 AWS のサーバーレス革命との類似企業が求めているのは「エージェントのインフラを構築すること」ではなく「動くエージェント」そのものだ。AWS がサーバー管理を EC2 で抽象化したのと同じ構造で、Anthropic はエージェント構築という市場そのものを縮小させる可能性がある。既に本番運用している企業 Anthropic の発表によると、Notion、Rakuten、Asana、Sentry がすでに Claude Managed Agents を本番環境で運用している。公式デモのダッシュボードでは、複数のエージェントがフリートとして稼働しタスクを処理している様子が確認できる。 OpenClaw 遮断との関連発表の4日前、Anthropic は OpenClaw をはじめとするサードパーティ製ハーネスによるサブスクリプション認証情報の利用をブロックした。消費者向け認証レイヤーの上にサービスを構築することを止め、代わりにファーストパーティのマネージドプラットフォームを提供するという戦略が明確になった。 ...

バフェット・コード徹底分析 — EDINET XBRLを活用した企業分析SaaSの全貌

前回の記事で EDINET の XBRL データを Python で扱う方法を紹介した。今回は、その仕組みを活用して構築されている企業分析サービス「バフェット・コード」を分析し、何ができるのかを網羅的にまとめる。バフェット・コードとはバフェット・コードは、EDINET（有価証券報告書）と TDNET（適時開示）の XBRL データをパースし、企業の財務情報をワンストップで分析できる SaaS サービスだ。バフェットコード株式会社が開発・運営している。データパイプラインの流れは以下の通り: EDINET / TDNET から XBRL ファイルを取得 XBRL をパースして RDB に格納過去データと株価を組み合わせて財務指標を算出スクリーニング・比較用のデータセットを更新このパイプラインの XBRL パース部分に、前回紹介した edinet_xbrl ライブラリが使われている。 Web アプリケーションでできることバフェット・コードの Web アプリ（buffett-code.com）では以下の機能が利用できる。企業分析財務データの閲覧: B/S（貸借対照表）、P/L（損益計算書）、C/S（キャッシュフロー計算書）を一覧表示企業概況: 設立日、上場日、事業内容などの基本情報役員一覧: 取締役・監査役の情報大株主情報: 四半期ごとの大株主構成セグメント情報: 事業セグメント別の業績データ類似企業の表示: 同業他社の自動提案スクリーニング・比較条件検索: 財務指標（PER、PBR、ROE 等）でフィルタリング企業比較: 複数企業の財務データを横並びで比較株主検索: 特定の株主が保有する企業を検索資料検索横断検索: EDINET・TDNET の資料に加え、各社の決算説明資料や統合報告書も横断的に検索 CSV ダウンロード: 年間業績や各種指標のダウンロード Web API でできることバフェット・コードは REST API（v4）を提供しており、プログラムから財務データにアクセスできる。API の利用には有償契約が必要だが、テスト用 API キーも用意されている。 ...

Claude Code

概要 Anthropic が開発する CLI ベースの AI コーディングエージェント。ターミナル上で対話しながらコードの読み書き、ファイル操作、git 操作、テスト実行などを行える。主な特徴 CLI ネイティブ: ターミナルで直接対話（IDE 拡張版も提供）ツール統合: ファイル読み書き、Bash 実行、Grep/Glob 検索、Web 検索等 CLAUDE.md: プロジェクトごとのルール・設定ファイル（圧縮後も再読み込みされる）サブエージェント: 複雑なタスクを並列エージェントに委任可能スキル/フック: カスタムワークフローの定義と自動化コンテキスト管理 5段階の圧縮カスケードでコンテキストウィンドウを管理する: Microcompact → Context Collapse → Session Memory → Full Compact → PTL Truncation 詳細: コンテキスト圧縮 LLM Wiki との関連 Karpathy は Claude Code を LLM Wiki の実行環境として使用。「左画面に Claude Code、右画面に Obsidian」というワークフローを実践。思考深度のサイレント・ダウングレード問題 2026年4月、AMD のシニア AI ディレクターが約 6,852 セッション分のログ分析で発見した問題。2026年3月8日以降、Claude Code の思考の中央値が約 2,200 文字から約 600 文字（67%減）に低下していた。Anthropic は「アダプティブ・シンキング」による変更を認め、/effort max コマンドで高い思考深度を維持できると説明した。 ...