「言語税」対策として CLAUDE.md を英語化する — 日本語境界を残したまま prompt caching を効かせる部分英語化パターン

Wed, 13 May 2026 00:00:00 +0000

背景: 日本語の「言語税」をどこで払うか

先日の記事で、日本語入出力が英語比 1.48 倍のトークンを消費すること、Claude では最大 1.94 倍にもなることを取り上げた。

しかし現実問題、ブログ記事本文・コミットメッセージ・GitHub PR の説明・許可プロンプトなど、最終アウトプットが日本語であること自体が要求であるケースは避けられない。Claude Code を使い続ける限り、日本語コストはゼロにはならない。

問いを言い換えると、こうなる:

「日本語境界を保ったまま、実トークン消費を構造的に減らせる場所はどこか？」

案	仕組み	効く場面	弱点
A. 翻訳プロキシ (Ollama)	ユーザー入力 ja→en、Claude 応答 en→ja を中間 LLM が翻訳	「思考・指示が日本語で出来ればよい」用途	ツール結果・ファイル内容・git diff まで翻訳経路に入り破綻
B. 部分英語化	思考・指示は英語、最終成果物は日本語のまま	大半の開発作業	削減率は応答側ほど効かない
C. Prompt Caching 徹底	CLAUDE.md・Skills・MCP 出力をキャッシュ	日本語のまま実コストを大幅削減	設計工数が必要
D. Caveman プロンプト	「原始人みたいに喋れ」で日本語応答を圧縮	既存実績手法（最大 80% 削減）	文体が崩れるので公開記事には不向き
E. モデル切替	Gemini など日本語効率の良いモデルへ部分委譲	翻訳・要約などコモディティ作業	Claude のハーネス連携を捨てる

「ローカル LLM で Claude Code の入出力を翻訳する」というアイデアは一見魅力的だが、Claude Code は対話 AI ではなく エージェント環境 であることを思い出す必要がある。

Wed, 13 May 2026 00:00:00 +0000

CLAUDE.md と 4 つの SKILL.md を日本語から英語に書き換えた結果、毎セッション読み込まれる固定資産のトークン量が 13,538 → 8,441（-37.6%、絶対値で 5,097 トークン削減） になった。

文字数は逆に +49% 増えているのに、トークンは大幅に減るという一見矛盾した結果である。理由と内訳を以下に示す。

CLAUDE.md 英語化の記事と Skills 英語化 PR (#394) の続編。

前 2 つの作業で、ハーネスの「内側」（LLM だけが読む固定資産）を英語化し、「外側」（人間が読むブログ記事や許可プロンプト）は日本語のまま維持する部分英語化パターンを実装した。

ただし、その記事では「Anthropic 公開の日本語比率 1.94x」から 推定 48% 削減 とラフに見積もっていた。実際の効果は推定モデル次第で 2% 〜 48% と幅があり、本当の値を知るには実測しかない。

PEP 668 で system Python が保護されているため、.claude/temp/venv-tiktoken/ に隔離した venv を作って tiktoken だけ入れた。