AIエージェントのコスト、指数関数的に上昇か

原題: Are the costs of AI agents also rising exponentially? (2025)

なぜ重要か

AIの実用性評価において、能力向上だけでなくコスト効率性の分析が重要であることを示唆している。

哲学者Toby Ordが、AIエージェントが実行できるタスクの長さは7年間で指数関数的に成長したが、そのコストも同様に増加している可能性があると指摘。GPT-2は数秒のタスクしかできなかったが、最新モデルは数時間のタスクを50%の確率で実行可能。しかしモデルサイズは4000倍、トークン生成数は10万倍に増加しており、コスト効率性に疑問を呈している。

AIエージェントの能力向上に関する重要な問題が見過ごされているとToby Ordが指摘した。METRの調査によると、AIエージェントが実行できるタスクの長さは過去7年間で指数関数的に成長している。GPT-2は数秒で完了するソフトウェアエンジニアリングタスクしか実行できなかったが、最新モデルは数時間を要するタスクを50%の確率で完了できる。

多くの人がこの傾向を外挿し、AIが1日、1週間、1年を要するタスクをいつ実行できるようになるかを予測している。しかし重要な情報が欠けている:作業実行のコストだ。

7年間でAIシステムは指数関数的に成長した。モデルサイズ(パラメータ数)は4000倍、各タスクでの実行回数(生成トークン数)は約10万倍に増加した。AI研究者は大幅な効率化を実現したが、METR測定のピーク性能のコストが指数関数的に成長している可能性は十分にある。

Ordは「時給」コストの概念を提示した。これはLLMがモデルの50%時間軸でタスクを完了する財務コストを、その時間軸の長さで割ったものだ。例えばClaude 4.1 Opusの50%時間軸は2時間で、人間のソフトウェアエンジニアが2時間を要するタスクを50%の確率で成功できる。

もしコストが時間軸より速く成長していれば、最先端AIシステムは人間と比べてコスト競争力を失っている可能性がある。この場合、METR時間軸トレンドは誤解を招く可能性があり、進歩の一部は計算資源への多額の支出によるもので、経済性から乖離しているかもしれない。

出典

tobyord.com — 元記事を読む →