AI自身がAIを構築する時代へ、Anthropicが再帰的自己改善の進展を報告
原題: When AI Builds Itself: Our progress toward recursive self-improvement
なぜ重要か
AIによる自己改善は技術史上の重要な発展となり、科学・医療分野に大きな恩恵をもたらす可能性がある一方、人間がAIを制御する方法の重要性が高まる。
Anthropic社は、AI系が自分自身の後継者を設計・開発する「再帰的自己改善」への進展状況を発表した。同社エンジニアは現在、2021-2023年比で8倍のコードを出荷している。ベンチマークでは、AIが完了できるタスクの長さが4ヶ月ごとに倍増し、Claude最新版は12時間のタスクを処理可能となった。
Anthropic社のThe Anthropic Instituteが、AIシステムによる再帰的自己改善の現状と将来への影響について詳細な分析を発表した。再帰的自己改善とは、AIシステムが完全に自律的に自分自身の後継者を設計・開発する能力を指す。同社によると、2021-2023年の初期段階では人間がラップトップでコードを書いていたが、現在では自律エージェントが数時間の作業を他のエージェントに委任できるまでに進化した。具体的な進展として、Anthropicのエンジニアは現在、2021-2025年平均と比較して四半期あたり8倍のコードを出荷している。外部ベンチマークでも顕著な改善が見られ、AIモデルが完了できるタスクの長さは4ヶ月ごとに倍増している。2024年3月にClaude Opus 3は人間が4分で完了するソフトウェアタスクを処理できたが、1年後のClaude Sonnet 3.7は1時間半のタスクを、さらに1年後のClaude Opus 4.6は12時間のタスクを管理できるようになった。ソフトウェア工学の標準テストであるSWE-benchでは、モデルの性能が2年間で一桁台から100%近くまで向上した。研究再現テストのCORE-Benchでは、2024年に約20%だった成功率が15ヶ月でベンチマークを飽和させた。