Claude のトークン消費が多くて困っているなら、システムプロンプトの一行変更だけで最大 80% 削減できる手法がある。深津 貴之(@fladdict)さんのポストをきっかけに、参照先の Zenn 記事が注目を集めた。
Claudeトークン消費を抑えて5倍使う: 「原始人」口調が80%削減 — mikana0918
以下にその要点をまとめる。
「原始人プロンプト」とは
システムプロンプトに次の一文を加えるだけ:
| |
これだけで Claude のデフォルト人格が切り替わり、丁寧語・クッション表現・冗長な接続詞が消え、応答が大幅に短くなる。
英語版「Caveman」テクニックとの対比
英語圏では “Speak like a caveman” という同様の手法が先行して存在する(JuliusBrussee/caveman)。除去される要素は以下のとおり:
| 除去対象 | 例 |
|---|---|
| 冠詞 | a / an / the |
| フィラー | just / really / basically |
| 前置き | “Sure! I’d be happy to…” |
| 曖昧表現 | might / perhaps / likely |
英語環境での実測では平均 68% のトークン削減が報告されている。
日本語では効果がさらに大きい理由
日本語には英語にない冗長構造が多い:
- 敬語・丁寧語: 「〜でございます」「〜かと存じます」
- クッション言葉: 「もしよろしければ」「ご参考までに」
- 助詞の連鎖: 「〜についての説明としては」
- 曖昧表現: 「〜かもしれません」「〜と思われます」
これらがまとめて削ぎ落とされるため、日本語環境では 80% 前後 の削減が見込める。
なぜトークンが減るのか
Claude はデフォルトで丁寧・共感的・詳細な回答スタイルを持つ。毎回「短くして」と指示するより、ペルソナ自体を切り替えるほうが確実にスタイルを維持できる。「原始人」や “caveman” はシステムプロンプトレベルで人格を上書きするため、会話全体を通じて効果が持続する。
Claude Code での設定方法
- 技術用語・コードは削らない: 「中身は全部残せ」を含めることで、情報量は保ちつつ表現だけを削ぎ落とす
- コンテキスト長が長いほど効果大: 長い会話ほどトークン削減の恩恵が積み上がる
CLAUDE.mdまたはシステムプロンプトに追記するだけで適用できる
まとめ
| 手法 | 削減率 | 対象 |
|---|---|---|
| Caveman(英語) | 約 68% | 英語応答 |
| 原始人(日本語) | 約 80% | 日本語応答 |
Claude Max プランの上限に頻繁に達する場合や、API コストを削減したい場合に特に有効だ。一行のシステムプロンプト変更として、真っ先に試す価値がある。