<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>コスト削減 on hdknr blog</title><link>https://hdknr.github.io/blogs/tags/%E3%82%B3%E3%82%B9%E3%83%88%E5%89%8A%E6%B8%9B/</link><description>Recent content in コスト削減 on hdknr blog</description><generator>Hugo -- 0.157.0</generator><language>ja</language><lastBuildDate>Thu, 23 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://hdknr.github.io/blogs/tags/%E3%82%B3%E3%82%B9%E3%83%88%E5%89%8A%E6%B8%9B/index.xml" rel="self" type="application/rss+xml"/><item><title>CLAUDE.md に1行追加するだけで Claude Code のコストが 1/3 に — plan モード強制テクニック</title><link>https://hdknr.github.io/blogs/posts/2026/04/claude.md-%E3%81%AB1%E8%A1%8C%E8%BF%BD%E5%8A%A0%E3%81%99%E3%82%8B%E3%81%A0%E3%81%91%E3%81%A7-claude-code-%E3%81%AE%E3%82%B3%E3%82%B9%E3%83%88%E3%81%8C-1/3-%E3%81%AB-plan-%E3%83%A2%E3%83%BC%E3%83%89%E5%BC%B7%E5%88%B6%E3%83%86%E3%82%AF%E3%83%8B%E3%83%83%E3%82%AF/</link><pubDate>Thu, 23 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/posts/2026/04/claude.md-%E3%81%AB1%E8%A1%8C%E8%BF%BD%E5%8A%A0%E3%81%99%E3%82%8B%E3%81%A0%E3%81%91%E3%81%A7-claude-code-%E3%81%AE%E3%82%B3%E3%82%B9%E3%83%88%E3%81%8C-1/3-%E3%81%AB-plan-%E3%83%A2%E3%83%BC%E3%83%89%E5%BC%B7%E5%88%B6%E3%83%86%E3%82%AF%E3%83%8B%E3%83%83%E3%82%AF/</guid><description>CLAUDE.md に plan モード強制の1行を追加するだけでトークン消費を 64%、コストを 69% 削減できる設定方法と仕組みを解説。</description></item><item><title>Claude を「原始人」口調にするとトークンが 80% 減る話</title><link>https://hdknr.github.io/blogs/posts/2026/04/claude-%E3%82%92%E5%8E%9F%E5%A7%8B%E4%BA%BA%E5%8F%A3%E8%AA%BF%E3%81%AB%E3%81%99%E3%82%8B%E3%81%A8%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E3%81%8C-80-%E6%B8%9B%E3%82%8B%E8%A9%B1/</link><pubDate>Fri, 17 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/posts/2026/04/claude-%E3%82%92%E5%8E%9F%E5%A7%8B%E4%BA%BA%E5%8F%A3%E8%AA%BF%E3%81%AB%E3%81%99%E3%82%8B%E3%81%A8%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E3%81%8C-80-%E6%B8%9B%E3%82%8B%E8%A9%B1/</guid><description>一行のシステムプロンプトで Claude のトークン消費を最大80%削減する「原始人」テクニック。英語版 Caveman との比較、日本語で効果が大きい理由、CLAUDE.md への適用方法まで解説。</description></item><item><title>Claude Code のデフォルト設定でトークンを無駄にしていた話</title><link>https://hdknr.github.io/blogs/posts/2026/04/claude-code-%E3%81%AE%E3%83%87%E3%83%95%E3%82%A9%E3%83%AB%E3%83%88%E8%A8%AD%E5%AE%9A%E3%81%A7%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E3%82%92%E7%84%A1%E9%A7%84%E3%81%AB%E3%81%97%E3%81%A6%E3%81%84%E3%81%9F%E8%A9%B1/</link><pubDate>Mon, 06 Apr 2026 00:00:00 +0000</pubDate><guid>https://hdknr.github.io/blogs/posts/2026/04/claude-code-%E3%81%AE%E3%83%87%E3%83%95%E3%82%A9%E3%83%AB%E3%83%88%E8%A8%AD%E5%AE%9A%E3%81%A7%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E3%82%92%E7%84%A1%E9%A7%84%E3%81%AB%E3%81%97%E3%81%A6%E3%81%84%E3%81%9F%E8%A9%B1/</guid><description>&lt;p&gt;Claude Code を使っていて「なんかコストかかるな…」と思ったことはないでしょうか。以前、デフォルト設定のまま使い続けると推定 2 億 6,400 万トークンもの無駄が発生するという事例が話題になりました。&lt;/p&gt;
&lt;p&gt;その後 Claude Code 自体が大幅に改善されましたが、トークン消費を意識した使い方は今でも重要です。本記事では、現在のバージョン（2026年4月時点）で有効な最適化ポイントを整理します。&lt;/p&gt;
&lt;h2 id="ツール検索の遅延ロードdeferred-tools"&gt;ツール検索の遅延ロード（Deferred Tools）&lt;/h2&gt;
&lt;p&gt;以前の Claude Code では、すべてのツール定義がセッション開始時にコンテキストに読み込まれ、大量のトークンを消費していました。&lt;code&gt;ENABLE_TOOL_SEARCH&lt;/code&gt; を明示設定することで改善できるという報告もありました。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;現在のバージョンでは、この問題はビルトインで解決されています。&lt;/strong&gt; ツール定義は「遅延ロード（Deferred Tools）」方式に変わり、ツール名だけがコンテキストに載り、実際のスキーマは必要になった時点で初めてロードされます。&lt;code&gt;ENABLE_TOOL_SEARCH&lt;/code&gt; を手動で設定する必要はありません。&lt;/p&gt;
&lt;h2 id="プロンプトキャッシュの-5-分-ttl--今も最大の落とし穴"&gt;プロンプトキャッシュの 5 分 TTL — 今も最大の落とし穴&lt;/h2&gt;
&lt;p&gt;Claude のプロンプトキャッシュは &lt;strong&gt;5 分&lt;/strong&gt;で期限切れになる。これは現在も変わっておらず、トークンコストに最も影響する要素だ。&lt;/p&gt;
&lt;p&gt;5 分休憩しただけで、会話全体が再処理され、コストが &lt;strong&gt;10 倍以上&lt;/strong&gt;に跳ね上がることがある。&lt;/p&gt;
&lt;p&gt;つまり:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;長時間セッションの途中で離席する&lt;/li&gt;
&lt;li&gt;ちょっと休憩してから作業再開する&lt;/li&gt;
&lt;li&gt;別の作業をしてから Claude Code に戻ってくる&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;といった行動がすべて、想定外のコスト増につながる。「休憩明けの最初のメッセージが一番高い」というのは、このキャッシュ再処理が原因だ。&lt;/p&gt;
&lt;h3 id="キャッシュを意識した作業フロー"&gt;キャッシュを意識した作業フロー&lt;/h3&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;5 分以内に次の操作を行う&lt;/strong&gt; — キャッシュが維持される&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;長い離席の前にセッションを終了する&lt;/strong&gt; — 戻ってきたら &lt;code&gt;/resume&lt;/code&gt; で再開した方が、コンテキストが圧縮されて効率的&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;タスクの区切りで &lt;code&gt;/compact&lt;/code&gt; を実行する&lt;/strong&gt; — 手動でコンテキストを圧縮し、次のキャッシュミス時のコストを下げる&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="コンテキスト自動圧縮を活かす"&gt;コンテキスト自動圧縮を活かす&lt;/h2&gt;
&lt;p&gt;Claude Code はコンテキストウィンドウの上限に近づくと、過去の会話を自動的に圧縮する。この仕組みのおかげで、長時間セッションでも会話が途切れることはない。&lt;/p&gt;
&lt;p&gt;ただし、圧縮時にはトークンが消費される。不要にコンテキストを膨らませないことが、結果的にコスト削減になる。&lt;/p&gt;
&lt;h3 id="コンテキストを膨らませない工夫"&gt;コンテキストを膨らませない工夫&lt;/h3&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;やりがちなこと&lt;/th&gt;
&lt;th&gt;改善策&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;大きなファイルを全行読む&lt;/td&gt;
&lt;td&gt;必要な範囲だけ &lt;code&gt;offset&lt;/code&gt; / &lt;code&gt;limit&lt;/code&gt; 指定で読む&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ビルドログをそのまま流す&lt;/td&gt;
&lt;td&gt;エラー時だけ出力を確認する&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;試行錯誤を同一セッションで続ける&lt;/td&gt;
&lt;td&gt;方針が変わったら新しいセッションで仕切り直す&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;CLAUDE.md に大量の指示を詰め込む&lt;/td&gt;
&lt;td&gt;必要最小限に保つ（毎ターンのコンテキストに載る）&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="現在のビルトイン最適化機能"&gt;現在のビルトイン最適化機能&lt;/h2&gt;
&lt;p&gt;2026年4月時点で Claude Code に組み込まれている主なトークン最適化機能:&lt;/p&gt;</description></item></channel></rss>