Anthropic、Claude Opus 4.8をリリース

原題: Claude Opus 4.8

なぜ重要か

AI言語モデルの性能向上により企業の自動化タスクの信頼性が向上し、エージェント機能の実用化が加速する可能性

Anthropicは5月28日、AI言語モデルClaude Opus 4.8を発表した。前バージョンのOpus 4.7から性能向上し、より効果的な協業が可能になった。価格は据え置きで同日から利用開始。高速モードは従来の3倍安価になり、処理速度は2.5倍向上した。

Claude Opus 4.8は、コーディング、エージェント機能、推論、実用的な知識作業タスクにおいて前バージョンを上回る性能を示している。新機能として、claude.aiユーザーがClaudeのタスクへの取り組み強度を制御できる機能、Claude Codeの大規模問題対応「動的ワークフロー」機能が追加された。早期テスターからは判断力の向上が評価されており、Staff EngineerのTom Pritchardは「適切な質問をし、自身の間違いを捉え、計画が不適切な場合は異議を唱える」と評価。Super-Agentベンチマークでは、Opus 4.8が全てのケースを完了した唯一のモデルとなり、GPT-5.5と同等コストでそれを上回る性能を示した。CursorBenchでは全ての努力レベルで前バージョンを超え、ツール呼び出しの効率が大幅に改善された。Legal Agent Benchmarkでは最高スコアを記録し、10%の全通過基準を初めて突破した。Online-Mind2Webでは84%のスコアを達成し、Opus 4.7とGPT-5.5を大きく上回った。

出典

anthropic.com — 元記事を読む →