autoresearch：Karpathyが公開した「寝ている間にAIが100実験を自律実行する」630行のスクリプト

OpenAI初期メンバーであるAndrej Karpathyが、autoresearchというオープンソースツールを公開しました。わずか630行のPythonスクリプトで、寝ている間にAIエージェントが約100の機械学習実験を自律的に実行してくれるというものです。

Karpathy「12月からコードを1行も書いていない」

Karpathyは「12月から自分でコードを1行も書いていない」と告白しています。代わりに公開したのがこのautoresearchで、プログラマーの仕事が「コードを書く」から「設計する」へとシフトしていることを象徴しています。

autoresearchの仕組み

autoresearchはシンプルな仕組みで動作します:

AIエージェントにトレーニングスクリプトと固定の計算バジェット（通常5分間のGPU時間）を渡す
エージェントが自分のソースコードを読み、改善の仮説を立てる
コードを修正し、実験を実行する
結果が改善されたかを評価し、改善なら保持・悪化なら破棄する
このサイクルを繰り返す

トレーニングは常に5分間で実行されるため、1時間あたり約12実験、一晩で約100実験が自動的に回ります。

実績と反響

Shopify CEO Tobias Lütke: 一晩で37実験を実行し、性能19%向上を達成
Karpathy自身: 700以上の実験を2日間で実行（Fortune誌報道）
GitHub: 公開1週間で数万スターを獲得（現在54,000以上）

技術的特徴

シングルGPU対応: 高価なクラスタは不要
630行のスクリプト: コードベースが小さく、理解・カスタマイズが容易
MITライセンス: 誰でも自由に利用可能
Python製: train.py を中心としたシンプルな構成

リポジトリ

GitHub: karpathy/autoresearch

「書く」から「設計する」への転換

autoresearchが示唆しているのは、世界最高峰のプログラマーの仕事が「AIにコードを書かせる」段階をすでに超え、AIエージェントに実験を設計・実行させるフェーズに入っているということです。Karpathyは将来的に、エージェント群が協調して小さなモデルをチューニングし、有望なアイデアを段階的にスケールアップさせる「研究コミュニティのエミュレーション」を構想しています。

Karpathy「12月からコードを1行も書いていない」#

autoresearchの仕組み#

実績と反響#

技術的特徴#

リポジトリ#

「書く」から「設計する」への転換#