OpenAI初期メンバーであるAndrej Karpathyが、autoresearchというオープンソースツールを公開しました。わずか630行のPythonスクリプトで、寝ている間にAIエージェントが約100の機械学習実験を自律的に実行してくれるというものです。

Karpathy「12月からコードを1行も書いていない」

Karpathyは「12月から自分でコードを1行も書いていない」と告白しています。代わりに公開したのがこのautoresearchで、プログラマーの仕事が「コードを書く」から「設計する」へとシフトしていることを象徴しています。

autoresearchの仕組み

autoresearchはシンプルな仕組みで動作します:

  1. AIエージェントにトレーニングスクリプトと固定の計算バジェット(通常5分間のGPU時間)を渡す
  2. エージェントが自分のソースコードを読み、改善の仮説を立てる
  3. コードを修正し、実験を実行する
  4. 結果が改善されたかを評価し、改善なら保持・悪化なら破棄する
  5. このサイクルを繰り返す

トレーニングは常に5分間で実行されるため、1時間あたり約12実験、一晩で約100実験が自動的に回ります。

実績と反響

  • Shopify CEO Tobias Lütke: 一晩で37実験を実行し、性能19%向上を達成
  • Karpathy自身: 700以上の実験を2日間で実行(Fortune誌報道)
  • GitHub: 公開1週間で数万スターを獲得(現在54,000以上)

技術的特徴

  • シングルGPU対応: 高価なクラスタは不要
  • 630行のスクリプト: コードベースが小さく、理解・カスタマイズが容易
  • MITライセンス: 誰でも自由に利用可能
  • Python製: train.py を中心としたシンプルな構成

リポジトリ

「書く」から「設計する」への転換

autoresearchが示唆しているのは、世界最高峰のプログラマーの仕事が「AIにコードを書かせる」段階をすでに超え、AIエージェントに実験を設計・実行させるフェーズに入っているということです。Karpathyは将来的に、エージェント群が協調して小さなモデルをチューニングし、有望なアイデアを段階的にスケールアップさせる「研究コミュニティのエミュレーション」を構想しています。