L'utilisation d'ordinateur 45x plus chère que les API structurées

Original : Computer Use is 45x more expensive than structured APIs

Pourquoi c'est important

Révèle l'inefficacité économique des agents visuels face aux API pour automatiser les tâches

Reflex a comparé deux approches IA pour une même tâche d'admin : agent vision (53 étapes, 551k tokens) vs agent API (8 appels, 12k tokens). L'agent vision n'a pas pu terminer la tâche complète contrairement à l'agent API.

Reflex a testé deux agents IA Claude Sonnet sur un même panneau d'administration : un agent vision utilisant des captures d'écran et clics via browser-use, et un agent API appelant directement les endpoints HTTP. La tâche consistait à trouver un client "Smith" avec le plus de commandes, localiser sa commande en attente récente, accepter ses avis en attente et marquer la commande comme livrée. L'agent API a réussi en 8 appels et 12k tokens. L'agent vision a nécessité 53 étapes et 551k tokens mais n'a trouvé qu'un seul avis sur quatre car il n'a pas paginé - les autres étaient hors de la zone visible. Cette approche coûte 45 fois plus cher selon Reflex.

Source

reflex.dev — Lire l'original →