OpenAI初期メンバーであるAndrej Karpathyが、autoresearchというオープンソースツールを公開しました。わずか630行のPythonスクリプトで、寝ている間にAIエージェントが約100の機械学習実験を自律的に実行してくれるというものです。
Karpathy「12月からコードを1行も書いていない」
Karpathyは「12月から自分でコードを1行も書いていない」と告白しています。代わりに公開したのがこのautoresearchで、プログラマーの仕事が「コードを書く」から「設計する」へとシフトしていることを象徴しています。
autoresearchの仕組み
autoresearchはシンプルな仕組みで動作します:
- AIエージェントにトレーニングスクリプトと固定の計算バジェット(通常5分間のGPU時間)を渡す
- エージェントが自分のソースコードを読み、改善の仮説を立てる
- コードを修正し、実験を実行する
- 結果が改善されたかを評価し、改善なら保持・悪化なら破棄する
- このサイクルを繰り返す
トレーニングは常に5分間で実行されるため、1時間あたり約12実験、一晩で約100実験が自動的に回ります。
実績と反響
- Shopify CEO Tobias Lütke: 一晩で37実験を実行し、性能19%向上を達成
- Karpathy自身: 700以上の実験を2日間で実行(Fortune誌報道)
- GitHub: 公開1週間で数万スターを獲得(現在54,000以上)
技術的特徴
- シングルGPU対応: 高価なクラスタは不要
- 630行のスクリプト: コードベースが小さく、理解・カスタマイズが容易
- MITライセンス: 誰でも自由に利用可能
- Python製:
train.pyを中心としたシンプルな構成
リポジトリ
- GitHub: karpathy/autoresearch
「書く」から「設計する」への転換
autoresearchが示唆しているのは、世界最高峰のプログラマーの仕事が「AIにコードを書かせる」段階をすでに超え、AIエージェントに実験を設計・実行させるフェーズに入っているということです。Karpathyは将来的に、エージェント群が協調して小さなモデルをチューニングし、有望なアイデアを段階的にスケールアップさせる「研究コミュニティのエミュレーション」を構想しています。