日本語 | hdknr blog

背景: 日本語の「言語税」をどこで払うか先日の記事で、日本語入出力が英語比 1.48 倍のトークンを消費すること、Claude では最大 1.94 倍にもなることを取り上げた。しかし現実問題、ブログ記事本文・コミットメッセージ・GitHub PR の説明・許可プロンプトなど、最終アウトプットが日本語であること自体が要求であるケースは避けられない。Claude Code を使い続ける限り、日本語コストはゼロにはならない。問いを言い換えると、こうなる: 「日本語境界を保ったまま、実トークン消費を構造的に減らせる場所はどこか？」検討した 5 案案仕組み効く場面弱点 A. 翻訳プロキシ (Ollama) ユーザー入力 ja→en、Claude 応答 en→ja を中間 LLM が翻訳「思考・指示が日本語で出来ればよい」用途ツール結果・ファイル内容・git diff まで翻訳経路に入り破綻 B. 部分英語化思考・指示は英語、最終成果物は日本語のまま大半の開発作業削減率は応答側ほど効かない C. Prompt Caching 徹底 CLAUDE.md・Skills・MCP 出力をキャッシュ日本語のまま実コストを大幅削減設計工数が必要 D. Caveman プロンプト「原始人みたいに喋れ」で日本語応答を圧縮既存実績手法（最大 80% 削減）文体が崩れるので公開記事には不向き E. モデル切替 Gemini など日本語効率の良いモデルへ部分委譲翻訳・要約などコモディティ作業 Claude のハーネス連携を捨てる翻訳プロキシ案 (A) が筋悪な理由「ローカル LLM で Claude Code の入出力を翻訳する」というアイデアは一見魅力的だが、Claude Code は対話 AI ではなくエージェント環境であることを思い出す必要がある。 ...