OpenAI、Codexエージェントが全コードを自動生成した製品開発実験を公開

原題: Harness engineering: Leveraging Codex in an agent-first world

なぜ重要か

AIエージェントによる完全自動コード生成が実用レベルに到達し、ソフトウェア開発の生産性を劇的に向上させる可能性を実証した重要な事例

OpenAIの開発チームが5か月間、Codexエージェントによる手動コード0行での製品開発実験を実施。100万行のコードを従来の10分の1の時間で生成し、3名のエンジニアが日平均3.5件のプルリクエストを処理。内部で数百名のユーザーが利用する実用レベルの製品を完成させた。

OpenAIのエンジニアリングチームは、手動でのコード記述を一切行わずにソフトウェア製品を開発する実験結果を発表した。2025年8月から5か月間で、Codexエージェントが全てのアプリケーションロジック、テスト、CI設定、ドキュメント、監視ツールを自動生成した。

実験では空のGitリポジトリから開始し、初期スキャフォールドもGPT-5を使用したCodex CLIが生成。最終的に約100万行のコードを含む製品となり、1,500件のプルリクエストが処理された。3名のエンジニアチームで日平均3.5件のプルリクエストを処理し、チームが7名に拡大しても生産性は向上し続けた。

開発された製品は社内で数百名のユーザーが利用し、外部アルファテストも実施。実際に運用される実用レベルの品質を達成した。チームは従来の10分の1の時間での開発を実現したと推定している。

エンジニアの役割は直接的なコーディングから、エージェントが効果的に作業できる環境設計、意図の仕様化、フィードバックループ構築に変化。初期段階では環境の仕様不足により進捗が遅れたが、エージェントが有用な作業を行えるツールと抽象化を整備することで大幅な生産性向上を実現した。

出典

openai.com — 元記事を読む →