Claude Code × ローカルLLM で KVキャッシュが毎回無効化される問題と対策

Claude Code をローカルLLM(llama.cpp、Ollama など)で使う際に、毎回プロンプト処理に異常な時間がかかるという問題が報告されています。原因は Claude Code が付加する「Attribution Header」によるKVキャッシュの無効化です。設定一つで解決できるので、対処法をまとめます。 何が起きているのか Claude Code v2.1.36 以降、リクエストごとに以下のような Attribution Header がプロンプトの先頭に付加されるようになりました。 x-anthropic-billing-header: cc_version=xxxx; cc_entrypoint=cli; cch=xxxx; この cch の値がリクエストのたびに変化します。ローカルLLMサーバー(llama.cpp、Ollama、LM Studio など)はプロンプトの先頭からバイト単位で一致した部分までKVキャッシュを再利用する仕組みのため、先頭が毎回変わるとキャッシュが丸ごと無効化されます。 結果として、数万トークンのシステムプロンプトや会話履歴を毎回ゼロから処理することになり、推論速度が最大90%低下するという報告があります。 対策:Attribution Header を無効化する ~/.claude/settings.json の env セクションに以下を追加します。 1 2 3 4 5 { "env": { "CLAUDE_CODE_ATTRIBUTION_HEADER": "0" } } 既に settings.json がある場合は env セクション内にキーを追加してください。 注意点 export CLAUDE_CODE_ATTRIBUTION_HEADER=0 ではダメ。シェルの環境変数として設定しても反映されません。必ず settings.json 経由で設定します ついでに不要なテレメトリも無効化しておくと、余計な通信を減らせます 1 2 3 4 5 6 7 { "env": { "CLAUDE_CODE_ATTRIBUTION_HEADER": "0", "CLAUDE_CODE_ENABLE_TELEMETRY": "0", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1" } } KVキャッシュの仕組みをおさらい ローカルLLMサーバーが採用している Prefix Caching(Automatic Prefix Caching)は、プロンプトの先頭から連続して一致するトークン列のKV(Key-Value)テンソルを再利用する仕組みです。 ...

2026年3月13日 · 1 分

Claude Codeで「AI チーフ・オブ・スタッフ」を構築する ― Jim Prosserの36時間実験

テックコミュニケーション・コンサルタントのJim Prosser氏が、Claude Codeを使って36時間で個人用AIアシスタントシステムを構築した。「My chief of staff, Claude Code」と題されたこの取り組みは、非エンジニアがClaude Codeのサブエージェント機能を活用して日常業務を自動化した実践例として注目を集めている。 システムの全体像 Prosser氏が構築したのは、毎朝起床前に自動で業務の下準備を完了させるシステムだ。常時稼働のMac Studio上で2つの自動プロセスが夜間に実行され、朝6:15までに処理が完了する。 主な機能: メール自動トリアージ — 受信メールからアクション可能な項目を特定し、Todoistのタスクと重複チェック カレンダー管理 — Google Maps APIを使った実際の移動時間計算を含むスケジュール最適化 6つの並列AIエージェント — Claude Codeのサブエージェント機能で独立したワーカーを同時実行 「AM Sweep」ボタンの仕組み Stream Deckの物理ボタンを押すと、6つの専門エージェントが並列で起動する: メール下書き作成(送信はしない、レビュー用の下書きのみ) Obsidianのクライアントファイル更新 ミーティングのスケジュール調整 見込み客やトピックのバックグラウンドリサーチ タスクの分類とコンテキスト収集 各エージェントは独自のコンテキストウィンドウとスコープされたツールアクセスを持ち、互いに干渉せずに動作する。 タスク4色分類フレームワーク Prosser氏は「dispatch, prep, yours, skip」の4段階でタスクを分類する: 色 分類 内容 🟢 緑 Dispatch AIが完全に処理 🟡 黄 Prep AIが80%完了、人間が仕上げ 🔴 赤 Yours 人間の判断が必要としてフラグ ⚪ 灰 Skip 理由付きで延期 重要なのは、判断に迷う場合は「Dispatch」ではなく「Prep」にデフォルトする設計だ。AIが勝手に完了させるのではなく、人間が最終判断する余地を常に残している。 人間とAIの境界線 このシステムの設計で最も重要な原則は「AIにやらせないことを決める」ことだ: メールは絶対に送信しない — 下書きのみ作成し、人間がレビューして送信 戦略的決定は人間が行う — 価格交渉、関係性に配慮が必要なコミュニケーションはAI対象外 不確実な場合はPrepにデフォルト — 自動処理より人間の関与を優先 Time Block機能 残タスクをカレンダーイベントに変換する機能も備えている: ...

2026年3月13日 · 1 分

Karpathy の autoresearch — LLMに「このLLMを訓練して」と丸投げしたら一晩で公式チームを超えた話

Andrej Karpathy が2026年3月に公開した autoresearch は、AIエージェントにLLMのトレーニングを丸投げするツールだ。GPU1台・一晩放置するだけで、エージェントが自律的にコード修正→実験→評価を繰り返し、人間の研究者なしで性能を改善していく。 実際に Karpathy 自身が約700回の実験を実行したところ、GPT-2の学習時間が2.02時間→1.80時間へ11%短縮された。さらに別の開発者は、8時間・37実験で0.8Bモデルが従来の1.6Bモデルを19%上回るスコアを叩き出している。 autoresearch の仕組み autoresearch はわずか630行のPythonで構成されており、3つのコアファイルで動作する。 3つのコンポーネント ファイル 役割 編集者 program.md エージェントへの指示書(戦略・ルール・評価基準) 人間 prepare.py データ準備・トークナイザー・評価関数(固定) 変更禁止 train.py モデル・オプティマイザ・学習ループ AIエージェント エージェントループ エージェントは以下のサイクルを自動で繰り返す: program.md を読んで戦略を把握 train.py を修正(アーキテクチャ変更、ハイパーパラメータ調整など) 5分間の固定時間でトレーニングを実行 val_bpb(検証ビット/バイト)が改善したか確認 改善 → 変更を保持、悪化 → 変更を破棄 1に戻る 5分の固定時間予算により、1時間あたり約12実験、一晩(8時間)で約100実験が可能になる。 実験結果 Karpathy 自身の実験 Karpathy は自身の nanochat(GPT-2トレーニング環境)に autoresearch を適用: 約700回の実験を2日間で実行 約20個の実質的な改善を発見 GPT-2到達時間: 2.02時間 → 1.80時間(11%短縮) 発見された改善の例: バッチサイズの半減(5分以内のステップ数増加) モデル深度の調整(depth 9への最適化) スライディングウィンドウ比率のチューニング コミュニティの成果 GitHub Discussions で報告された改善: Discussion #32: val_bpb を 0.9979 → 0.9773 に改善(89実験、H100 80GB) Discussion #43: val_bpb を 0.9979 → 0.9697 に改善(126実験、H100 80GB) Tobi のケース: 0.8Bモデルが従来の1.6Bモデルを 19%上回るスコア(37実験、8時間) 使用されるLLM autoresearch のエージェントとして動作するLLM自体は外部モデルを使用する。Karpathy のテストでは Claude や GPT 系モデルが使われている。 ...

2026年3月13日 · 2 分

営業向けClaude Code活用術:/mtg-prepで商談準備が5分で終わる世界線

DAIJOBU CEO の山中裕貴(@0xfene)氏が、Claude Code のカスタムスキル機能を営業業務に活用し、商談準備を劇的に効率化した事例を紹介している。 従来の商談準備の課題 営業担当者の商談サイクルには、以下のような時間のかかるタスクが含まれる: 商談前: 30分〜1時間かけて Gmail・Slack・議事録ツールから過去のやり取りを手動で情報収集 商談中: 準備不足で焦ることがある 商談後: 15〜20分かけてフォローメールを作成 Claude Code スキルによる自動化 山中氏は Claude Code のスキル機能(.claude/skills/ 配下にプロンプトを定義する仕組み)を使い、営業ワークフロー全体を自動化した。 /mtg-prep — 商談準備の自動化 /mtg-prep コマンドを実行すると、複数の AI エージェントが並行稼働し、以下の情報を 2〜3分で収集・整理する: 過去のやり取り: Gmail、Slack、Circleback(AI 議事録サービス)から顧客との過去のコミュニケーションを取得 顧客調査: 企業情報、業界動向のリサーチ 競合調査: 競合他社の状況を自動調査 提案ドラフト: 確認事項、提案の方向性、想定質問、フォローアップのアクションプランを整理 結果はマークダウンファイルとしてローカルに保存される。 /follow-up — 商談後フォローの自動化 商談終了直後に /follow-up コマンドを実行すると、商談の内容を踏まえたフォローメールが 2〜3分で自動生成される。記憶が鮮明なうちに具体的な内容を含んだメールを送れるのがポイントだ。 /export-gdoc — ドキュメント共有 作成されたマークダウンファイルを Google ドキュメントに変換し、Notion スタイルの統一されたデザインで社内共有やクライアントへの提案に活用できる。 導入効果 山中氏によると、Claude Code 導入後は 体感で 3〜5倍の商談量を品質を下げずに捌ける ようになったという。 項目 導入前 導入後 商談準備 30分〜1時間 2〜3分(/mtg-prep) 商談中 準備不足で焦る場面も 相手の話に集中できる フォローメール 15〜20分 2〜3分(/follow-up) Claude Code スキルの仕組み Claude Code のスキル機能は、プロジェクトの .claude/skills/ ディレクトリにマークダウンファイルとしてプロンプトを定義する。/スキル名 でスラッシュコマンドとして呼び出せるため、営業担当者でも簡単に利用できる。 ...

2026年3月13日 · 1 分

AIエージェント同士をつなぐRelay基盤 — 会話とtransportを分離するアーキテクチャ

AIエージェントが単独で動く時代から、複数のエージェントが協調して動く時代へ移行しつつある。エージェント間の通信を設計するとき、「会話(何を話すか)」と「transport(どう届けるか)」を分離する考え方が重要になっている。本記事では、2026年に整備が進むエージェント間通信プロトコルの全体像と、Relay基盤のアーキテクチャを整理する。 なぜ「会話」と「transport」を分離するのか AIエージェント同士が会話する際、2つの関心事が混在しがちだ: 会話層: タスクの依頼、進捗報告、結果の返却といった「意味のあるやりとり」 transport層: HTTP、gRPC、WebSocket、SSE といった「届ける仕組み」 これらを密結合にすると、transport を変更するたびに会話ロジックを書き直す必要が生じる。たとえば、開発時は HTTP で通信していたエージェントを、本番では gRPC に切り替えたいケースや、ローカルの関数呼び出しからリモートの API 呼び出しに切り替えたいケースがある。 分離することで、エージェントのビジネスロジック(会話)は transport に依存せず、transport の差し替えが容易になる。 2026年のエージェント間通信プロトコル 現在、エージェント通信の標準化が急速に進んでいる。主要なプロトコルは以下の通り。 MCP(Model Context Protocol) Anthropic が策定したプロトコルで、エージェントと外部ツール/リソースの接続を標準化する。API、ファイルシステム、データベースへのアクセスを統一的なインターフェースで提供する。 役割: ツール・コンテキスト層 transport: RESTful サーバー経由の構造化データ交換 エージェント → MCP サーバー → 外部ツール(DB, API, ファイル) A2A(Agent-to-Agent Protocol) Google が主導し、50社以上のパートナーが参加するオープン標準。エージェント同士のピアツーピア通信とタスク委譲を実現する。 役割: エージェント間通信層 transport: HTTPS 上の JSON-RPC 2.0 + SSE(ストリーミング) 通信モデル: クライアントエージェント → リモートエージェント クライアントエージェント ──JSON-RPC──→ リモートエージェント ←──SSE──── A2A の特徴は、エージェントの内部メモリ、ツール、ロジックを共有せずに協調できる点。発見(Discovery)→ 認可(Authorization)→ 通信(Communication)の3段階で動作する。 ACP(Agent Communication Platform) REST ベースの通信とエージェントレジストリを組み合わせたプラットフォーム。 役割: レジストリ駆動の通信基盤 transport: REST インターフェース 特徴: ステートフルなメッセージルーティングでコンテキストを保持 ANP(Agent Network Protocol) インターネット規模のエージェント協調を想定したプロトコル。 ...

2026年3月12日 · 2 分

AIプログラマティックSEO:JSON Schemaで13,000ページを3時間で生成し、トラフィックを5.7倍にした手法

SEO・コンテンツマーケティングの専門家 Jake Ward 氏が、AI とプログラマティック SEO を組み合わせて 60日間で SEO トラフィックを466%(5.7倍)増加 させた手法が注目を集めています。13,000ページ以上をわずか3時間で生成し、週間オーガニッククリックを971から5,500に伸ばした具体的なアプローチを解説します。 成果の概要 13,000+ ページを3時間で生成 週間オーガニッククリック: 971 → 5,500(+466%) 60日間で達成 従来のプログラマティック SEO との違い 従来のプログラマティック SEO は、テンプレートの単語を置換するだけのものが多く、低品質なページが量産される問題がありました。Jake Ward 氏のアプローチは、AI にフリーフォームでコンテンツを書かせるのではなく、厳密な JSON Schema を埋め込むことで品質を担保しています。 3つの核心ポイント 1. JSON Schema によるコンテンツ構造化 最も重要な技術的要素が、AI への指示に厳密な JSON Schema を使うことです。 1 2 3 4 5 6 7 8 9 10 11 12 13 { "section_title": "string", "items": [ { "name": "string", "description": "string (50-100 words)", "difficulty_level": "beginner | intermediate | advanced", "potential_score": "number (1-10)" } ], "min_items": 15, "max_items": 20 } AI にフリーフォームの文章を書かせると、ページごとに品質がばらつきます。JSON Schema で出力形式を固定することで、13,000ページ全体で一貫した品質を維持できます。 ...

2026年3月12日 · 1 分

Claude Code に Auto Mode が登場 — 許可プロンプトなしで長時間タスクを実行

Anthropic が Claude Code にリサーチプレビューとして「Auto Mode」を導入しました。claude --permission-mode auto で起動すると、ツール使用の許可判断を Claude 自身が行い、開発者の手動承認なしで長時間の連続作業が可能になります。 Auto Mode とは 従来の Claude Code では、ファイルの書き込みやシェルコマンドの実行のたびに許可プロンプトが表示されていました。これは安全性の面では重要ですが、長時間のタスクでは開発フローが頻繁に中断される原因になっていました。 Auto Mode はこの問題に対処するもので、各操作について Claude 自身がリスクを判断し、安全と判断した操作は自動で承認します。 使い方 起動時にフラグを指定します: 1 claude --permission-mode auto または、セッション中に Shift+Tab で許可モードを切り替えることもできます。 既存の許可モードとの比較 Claude Code には複数の許可モードがあります: モード 動作 Normal 操作ごとに許可を求める(デフォルト) Auto-accept edit ファイル編集は自動承認、シェルコマンドは確認 Auto Mode Claude がリスク判断して自動承認(新機能) Plan 読み取り専用、変更は一切行わない Auto Mode は --dangerously-skip-permissions のような全許可フラグとは異なり、Claude がリスク分類を行った上で判断するため、安全性と利便性のバランスを取ったアプローチです。 セキュリティ上の注意点 Auto Mode は万能ではありません。Anthropic は以下の点を注意喚起しています: 隔離環境での使用を推奨: 本番環境の認証情報やライブ API へのアクセスがあるマシンでは使わない プロンプトインジェクション対策: ファイルやコマンド出力内の悪意ある指示から保護する機能を搭載 トークン使用量の増加: リスク判断のオーバーヘッドにより、若干のコスト・レイテンシ増加がある 組織での管理 IT 管理者は Auto Mode を制限することもできます: ...

2026年3月12日 · 1 分

Claude Code の Skills でプロンプト履歴を分析し、新人教育に活用する

Claude Code の Skills 機能を使って、過去のプロンプト入力履歴をスキャンし、利用者が「何を分かっていて、何を分かっていないか」を可視化する仕組みが紹介されていました。プロンプトを通じた新人教育の可能性を探ります。 アイデアの概要 @tokoroten氏のポストで紹介されたアプローチは以下の通りです: Claude Code の Skills を利用して、過去のプロンプト入力履歴をスキャンする その履歴から、利用者が何を理解していて、何を理解していないかを分析・出力する 結果として、どの技術分野の理解が甘いかが可視化される これにより、プロンプトを通じた新人教育が可能になる Claude Code Skills とは Claude Code の Skills は、再利用可能なプロンプトテンプレートをプロジェクト内に定義できる機能です。.claude/skills/ ディレクトリにスキル定義を配置することで、/スキル名 のようなスラッシュコマンドとして呼び出せます。 .claude/ skills/ analyze-prompts/ skill.md # スキルの定義・プロンプト スキルには以下のような特徴があります: プロジェクト固有のワークフローを定義できる 引数を受け取ることが可能 複数のツール呼び出しを組み合わせた複雑な処理を自動化できる プロンプト履歴から理解度を分析する仕組み このアプローチの面白いところは、プロンプト(質問)の内容自体が「その人が何を知らないか」の強力なシグナルになるという点です。 分析の観点 質問の頻度: 特定の技術領域について繰り返し質問しているなら、その分野の理解が浅い可能性が高い 質問の深さ: 基本的な概念を聞いているのか、応用的な質問をしているのかで理解度が測れる 自己解決率: 同じトピックの質問が減っていれば、学習が進んでいると判断できる 教育への応用 従来の新人教育では、メンターが1対1でレビューしたり、定期的な面談で理解度を確認したりする必要がありました。このアプローチでは: 受動的な観察: 普段の業務でのプロンプト利用を分析するだけで、能動的なヒアリングが不要 定量的な評価: どの分野にどれだけ質問しているかを数値化できる 継続的なトラッキング: 時系列での成長を追跡できる 実現に向けた考慮点 このような仕組みを導入する際には、いくつかの点を考慮する必要があります。 プライバシーへの配慮 プロンプト履歴には業務上の機密情報が含まれる可能性があるため、分析対象の範囲や匿名化の方法を検討する必要があります。 分析精度の担保 単純なキーワードマッチだけでは正確な理解度評価は難しく、文脈を考慮した分析が求められます。Claude Code 自体の言語理解能力を活かすことで、より精度の高い分析が可能になるでしょう。 フィードバックループの構築 分析結果を本人にフィードバックし、推奨学習リソースを提示するところまで自動化できれば、より実用的な教育ツールになります。 まとめ Claude Code の Skills を活用したプロンプト履歴分析は、AI ツールの利用ログそのものを教育データとして活用するという発想です。新人が日常的に AI に質問する行為自体が、自然と学習進捗の記録になるというのは、AI 時代ならではの教育アプローチと言えます。

2026年3月12日 · 1 分

Claude Codeで大量データを扱うならSQLite/DuckDBを使おう

Claude Code で Markdown や JSON ファイルを直接編集してデータ管理を行うのは、少量のデータなら問題ありません。しかし、レコード数が100件を超えるような規模になると、スキーマ違反や細かいスクリプト制御の問題、パフォーマンスの低下が発生しやすくなります。こうした場面では、SQLite や DuckDB を活用するのが効果的です。 Markdown/JSON 直接編集の限界 Claude Code にMarkdown ファイルや JSON ファイルを直接編集させる方法は、手軽で分かりやすい反面、データ量が増えると以下の問題が顕在化します。 スキーマ違反: JSON の構造が崩れたり、必須フィールドが欠落するケースが発生する 細かいスクリプト制御が必要になる: データの整合性を保つために、バリデーションや変換のスクリプトが増えていく パフォーマンス低下: ファイル全体を読み込んで書き戻す処理が、レコード数に比例して遅くなる SQLite を使うメリット SQLite はファイルベースの軽量データベースで、Claude Code との相性が良好です。 1 2 3 4 5 6 # SQLite データベースを作成してテーブルを定義 sqlite3 data.db "CREATE TABLE items (id INTEGER PRIMARY KEY, name TEXT, value REAL);" # Claude Code から SQL でデータを操作 sqlite3 data.db "INSERT INTO items (name, value) VALUES ('example', 42.0);" sqlite3 data.db "SELECT * FROM items WHERE value > 10;" ACID準拠: データの整合性がデータベースエンジンによって保証される SQL によるクエリ: 複雑な検索・集計・更新が簡潔に記述できる 単一ファイル: .db ファイル1つで完結し、バックアップやコピーが容易 DuckDB を使うメリット DuckDB は分析用途に特化したインプロセスデータベースです。CSV、Parquet、JSON などのファイルを直接 SQL でクエリできます。 ...

2026年3月12日 · 2 分

CLAUDE.mdを採点・改善してくれるClaude Code公式プラグイン claude-md-improver

Claude Code を使っていると、プロジェクトのコンテキストを伝える CLAUDE.md の質が作業効率に直結することに気づきます。Anthropic 公式プラグイン claude-md-management に含まれる claude-md-improver スキルは、CLAUDE.md を自動で採点し、改善点を提案してくれる便利なツールです。 claude-md-management プラグインとは claude-md-management は、Anthropic が公式に管理している Claude Code プラグインです。CLAUDE.md ファイルの品質を監査し、セッションで得た知見を反映するための2つのスキルを提供します。 スキル 呼び出し方 目的 使いどころ claude-md-improver 会話で依頼 CLAUDE.md をコードベースの現状に合わせる 定期的なメンテナンス revise-claude-md /claude-md-management:revise-claude-md セッション中の学びを記録する セッション終了時 注意: /revise-claude-md のような短縮名では呼び出せません。必ず /claude-md-management:revise-claude-md と完全修飾名を使ってください。 インストール方法 公式マーケットプレイスは Claude Code 起動時に自動で利用可能になっているため、以下のコマンドだけでインストールできます。 1 /plugin install claude-md-management@claude-plugins-official UI からインストールする場合は、/plugin を実行して Discover タブから claude-md-management を選択します。インストールスコープは以下の3種類から選べます。 スコープ 説明 User 自分の全プロジェクトで有効(デフォルト) Project このリポジトリの全コラボレーターで有効(.claude/settings.json に記録) Local このリポジトリの自分だけで有効 インストール後、/reload-plugins を実行すると再起動なしで有効化されます。 claude-md-improver の使い方 Claude Code のセッション中に、以下のように話しかけるだけで起動します。 ...

2026年3月12日 · 2 分