Anthropic の AI コーディングツール「Claude Code」の思考能力が密かに大幅削減されたのではないか——2026年4月、AMD の AI ディレクターによるセッションログの詳細分析が SNS 上で大きな議論を巻き起こしました。本記事では、何が起きたのか、Anthropic はどう説明しているのか、そしてユーザーが取れる対策を整理します。
発端:7,000セッションのログ分析
AMD シニア AI ディレクターの Stella Laurenzo 氏(GitHub: stellaraccident)が、2026年4月2日に GitHub Issue(anthropics/claude-code#42796)を投稿しました。同氏は2026年1月から3月にかけての Claude Code セッションログ(約6,852セッション、234,760ツールコール、17,871思考ブロック)を分析し、以下の変化を報告しています。
| 指標 | 変更前(1月末〜2月中旬) | 変更後(3月8日〜23日) |
|---|---|---|
| 思考の中央値(文字数) | 約2,200文字 | 約600文字(67%減) |
| 読み取り/編集比率 | 6.6回 | 2.0回 |
| APIリクエスト数 | ベースライン | 80倍増(2月→3月) |
| 「続けますか?」と確認する回数 | 0回 | 17日間で173回 |
| 推論中の自己矛盾 | ベースライン | 3倍 |
特に「reads-per-edit」(コードを編集する前にファイルを読む回数)が 6.6 から 2.0 に低下した点は深刻です。モデルがコードを十分に理解しないまま編集を行うようになったことを示唆しています。
Anthropic の公式説明
Anthropic は2つの意図的な変更を認めました。
1. アダプティブ・シンキング(Adaptive Thinking)の導入
2026年2月9日に導入。タスクの複雑さに応じてモデルが動的に思考の深さを決定する機能です。簡単な質問には短い思考で、複雑なタスクには長い思考で対応することで、レイテンシとコストを最適化する狙いがあります。
2. デフォルトのエフォートレベル変更
2026年3月3日に、Claude Code のデフォルトエフォート設定が「high」から「medium」に変更されました。これにより、明示的に設定を変更していないユーザーは、以前より浅い思考で応答を受け取るようになりました。
思考リダクション(redact-thinking)について
2026年2月12日に導入された redact-thinking ヘッダーについても懸念が広がりましたが、Claude Code の開発者である Boris Cherny 氏は、これは UI 上で思考内容を非表示にするだけであり、モデルの推論深度自体は削減していないと説明しています。一方で、Cherny 氏はアダプティブ・シンキングが「特定のターンで推論を過少割り当てしていた」ことも認めています。さらに「ハルシネーション(存在しないコミット SHA やパッケージ名の捏造)が発生したターンでは推論が一切出力されていなかった」とも述べています。
なぜこれが問題なのか
コスト転嫁の構造
思考が浅くなった結果、モデルはより多くのエラーを出し、リトライが増加しました。Laurenzo 氏の分析では、API リクエスト数が80倍に増加しています。つまり、Anthropic 側の推論コストは削減されたものの、ユーザー側のトークン消費(=課金額)はむしろ増大するという構造的な問題が生じています。
複雑なタスクへの影響
エフォートレベルの低下は、単純なコード補完には影響が少ないものの、大規模なコードベースでの複雑なエンジニアリングタスクに大きな影響を与えます。Laurenzo 氏は「Claude は複雑なエンジニアリングタスクにおいて信頼できなくなった」と結論づけています。
時間帯による品質差
興味深いことに、PST の午後5時と午後7時(日本時間の翌午前10時〜正午頃)が最も品質が低く、深夜帯は大幅に改善するというパターンも報告されています。これは思考の割り当てが GPU 負荷に連動している可能性を示唆しています。
ユーザーが取れる対策
1. エフォートレベルを max に設定
Claude Code 内で /effort max コマンドを実行すると、思考の深さを最大に設定できます。
| |
2. アダプティブ・シンキングの無効化
環境変数を設定することで、モデルが動的に思考量を決定する機能を無効化し、常に深い思考を強制できます。
| |
これらの設定により、2月以前の「常に深く考える」挙動を復元できます。ただし、レスポンス時間が長くなり、トークン消費も増える点はトレードオフです。
3. 思考ブロックのモニタリング
API を直接利用している場合は、レスポンスに含まれる思考ブロックの文字数をモニタリングすることで、品質の変化を追跡できます。
業界への波紋
この問題は AI コーディングツール市場全体に影響を与えています。AMD のエンジニアリングチームは、Claude Code から競合ツールへの移行を進めたと報じられています。また、この事例は「AI サービスにおけるサイレント・ダウングレード」(ユーザーへの告知なしに性能を下げること)のリスクを浮き彫りにしました。
SaaS と異なり、AI モデルのサービスは同じ API エンドポイントでもバックエンドの挙動が変わり得るため、ユーザーが品質変化を検知・証明することが困難です。Laurenzo 氏の分析のように、セッションログを定量的に記録・比較する仕組みが今後ますます重要になるでしょう。
まとめ
- AMD AI ディレクターの分析により、Claude Code の思考深度が約67%低下していることが定量的に示された
- Anthropic は「アダプティブ・シンキング」と「デフォルトエフォートの引き下げ」という2つの変更を認めた
- ユーザーは
/effort maxやアダプティブ・シンキング無効化で対策可能 - AI コーディングツールの品質を客観的にモニタリングする仕組みの必要性が改めて認識された