Microsoft lance ASSERT pour les tests d'IA via descriptions texte

Original : New Microsoft tool lets devs spin up AI behavior tests using text descriptions

Pourquoi c'est important

Simplifie les tests de comportement IA pour applications spécifiques

Microsoft dévoile ASSERT, un framework open source permettant aux développeurs de créer des tests de comportement IA à partir de descriptions en langage naturel pour valider des politiques spécifiques aux applications.

Microsoft présente ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing), un framework open source qui transforme des descriptions en langage naturel d'objectifs et politiques d'IA en tests structurés et notés. L'outil génère automatiquement des scénarios de test, les exécute contre le système cible et évalue les résultats. Il peut enregistrer les chemins d'actions intermédiaires pour diagnostiquer les échecs. Sarah Bird, responsable produit IA responsable chez Microsoft, souligne que les évaluations sont critiques pour comprendre le comportement des systèmes IA. ASSERT comble un vide laissé par les évaluations générales en se concentrant sur des comportements spécifiques aux applications et contextes produits.

Source

techcrunch.com — Lire l'original →