<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>プロンプトキャッシュ on hdknr blog</title><link>https://hdknr.github.io/blogs/tags/%E3%83%97%E3%83%AD%E3%83%B3%E3%83%97%E3%83%88%E3%82%AD%E3%83%A3%E3%83%83%E3%82%B7%E3%83%A5/</link><description>Recent content in プロンプトキャッシュ on hdknr blog</description><generator>Hugo -- 0.157.0</generator><language>ja</language><lastBuildDate>Fri, 17 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://hdknr.github.io/blogs/tags/%E3%83%97%E3%83%AD%E3%83%B3%E3%83%97%E3%83%88%E3%82%AD%E3%83%A3%E3%83%83%E3%82%B7%E3%83%A5/index.xml" rel="self" type="application/rss+xml"/><item><title>Claude Code のデフォルト設定でトークンを無駄にしていた話</title><link>https://hdknr.github.io/blogs/posts/2026/04/claude-code-%E3%81%AE%E3%83%87%E3%83%95%E3%82%A9%E3%83%AB%E3%83%88%E8%A8%AD%E5%AE%9A%E3%81%A7%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E3%82%92%E7%84%A1%E9%A7%84%E3%81%AB%E3%81%97%E3%81%A6%E3%81%84%E3%81%9F%E8%A9%B1/</link><pubDate>Mon, 06 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/posts/2026/04/claude-code-%E3%81%AE%E3%83%87%E3%83%95%E3%82%A9%E3%83%AB%E3%83%88%E8%A8%AD%E5%AE%9A%E3%81%A7%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E3%82%92%E7%84%A1%E9%A7%84%E3%81%AB%E3%81%97%E3%81%A6%E3%81%84%E3%81%9F%E8%A9%B1/</guid><description>&lt;p&gt;Claude Code を使っていて「なんかコストかかるな…」と思ったことはないでしょうか。以前、デフォルト設定のまま使い続けると推定 2 億 6,400 万トークンもの無駄が発生するという事例が話題になりました。&lt;/p&gt;
&lt;p&gt;その後 Claude Code 自体が大幅に改善されましたが、トークン消費を意識した使い方は今でも重要です。本記事では、現在のバージョン（2026年4月時点）で有効な最適化ポイントを整理します。&lt;/p&gt;
&lt;h2 id="ツール検索の遅延ロードdeferred-tools"&gt;ツール検索の遅延ロード（Deferred Tools）&lt;/h2&gt;
&lt;p&gt;以前の Claude Code では、すべてのツール定義がセッション開始時にコンテキストに読み込まれ、大量のトークンを消費していました。&lt;code&gt;ENABLE_TOOL_SEARCH&lt;/code&gt; を明示設定することで改善できるという報告もありました。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;現在のバージョンでは、この問題はビルトインで解決されています。&lt;/strong&gt; ツール定義は「遅延ロード（Deferred Tools）」方式に変わり、ツール名だけがコンテキストに載り、実際のスキーマは必要になった時点で初めてロードされます。&lt;code&gt;ENABLE_TOOL_SEARCH&lt;/code&gt; を手動で設定する必要はありません。&lt;/p&gt;
&lt;h2 id="プロンプトキャッシュの-5-分-ttl--今も最大の落とし穴"&gt;プロンプトキャッシュの 5 分 TTL — 今も最大の落とし穴&lt;/h2&gt;
&lt;p&gt;Claude のプロンプトキャッシュは &lt;strong&gt;5 分&lt;/strong&gt;で期限切れになる。これは現在も変わっておらず、トークンコストに最も影響する要素だ。&lt;/p&gt;
&lt;p&gt;5 分休憩しただけで、会話全体が再処理され、コストが &lt;strong&gt;10 倍以上&lt;/strong&gt;に跳ね上がることがある。&lt;/p&gt;
&lt;p&gt;つまり:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;長時間セッションの途中で離席する&lt;/li&gt;
&lt;li&gt;ちょっと休憩してから作業再開する&lt;/li&gt;
&lt;li&gt;別の作業をしてから Claude Code に戻ってくる&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;といった行動がすべて、想定外のコスト増につながる。「休憩明けの最初のメッセージが一番高い」というのは、このキャッシュ再処理が原因だ。&lt;/p&gt;
&lt;h3 id="キャッシュを意識した作業フロー"&gt;キャッシュを意識した作業フロー&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;5 分以内に次の操作を行う&lt;/strong&gt; — キャッシュが維持される&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;長い離席の前にセッションを終了する&lt;/strong&gt; — 戻ってきたら &lt;code&gt;/resume&lt;/code&gt; で再開した方が、コンテキストが圧縮されて効率的&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;タスクの区切りで &lt;code&gt;/compact&lt;/code&gt; を実行する&lt;/strong&gt; — 手動でコンテキストを圧縮し、次のキャッシュミス時のコストを下げる&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="コンテキスト自動圧縮を活かす"&gt;コンテキスト自動圧縮を活かす&lt;/h2&gt;
&lt;p&gt;Claude Code はコンテキストウィンドウの上限に近づくと、過去の会話を自動的に圧縮する。この仕組みのおかげで、長時間セッションでも会話が途切れることはない。&lt;/p&gt;
&lt;p&gt;ただし、圧縮時にはトークンが消費される。不要にコンテキストを膨らませないことが、結果的にコスト削減になる。&lt;/p&gt;
&lt;h3 id="コンテキストを膨らませない工夫"&gt;コンテキストを膨らませない工夫&lt;/h3&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;やりがちなこと&lt;/th&gt;
&lt;th&gt;改善策&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;大きなファイルを全行読む&lt;/td&gt;
&lt;td&gt;必要な範囲だけ &lt;code&gt;offset&lt;/code&gt; / &lt;code&gt;limit&lt;/code&gt; 指定で読む&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ビルドログをそのまま流す&lt;/td&gt;
&lt;td&gt;エラー時だけ出力を確認する&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;試行錯誤を同一セッションで続ける&lt;/td&gt;
&lt;td&gt;方針が変わったら新しいセッションで仕切り直す&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;CLAUDE.md に大量の指示を詰め込む&lt;/td&gt;
&lt;td&gt;必要最小限に保つ（毎ターンのコンテキストに載る）&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="現在のビルトイン最適化機能"&gt;現在のビルトイン最適化機能&lt;/h2&gt;
&lt;p&gt;2026年4月時点で Claude Code に組み込まれている主なトークン最適化機能:&lt;/p&gt;</description></item></channel></rss>