Les modèles IA « dangereux » arriveront inévitablement

Original : "Dangerous" AI models are coming no matter what

Pourquoi c'est important

Illustre l'impossibilité de contrôler la prolifération des capacités IA avancées potentiellement dangereuses face à la concurrence technologique mondiale.

Anthropic a retiré ses modèles Claude Fable 5 et Mythos 5 suite à une directive gouvernementale américaine. Les experts avertissent que d'autres entreprises développent déjà des capacités similaires de piratage avancé, rendant impossible l'arrêt de cette tendance technologique.

Anthropic a mis hors ligne ses modèles Claude Fable 5 et Mythos 5 la semaine dernière en réponse à une directive du gouvernement américain interdisant l'accès à ces services aux ressortissants étrangers. L'entreprise négocie avec la Maison-Blanche depuis vendredi pour trouver un accord permettant de réactiver ces offres. Mythos, lancé en avril, possède des capacités avancées pour identifier les vulnérabilités logicielles et exploiter ces failles, ce qui pourrait être utilisé par des acteurs malveillants. Anthropic a reconnu cet usage double en notant que « les mêmes requêtes bénéfiques aux professionnels de la cybersécurité pourraient être dangereuses aux mains d'acteurs malveillants ». L'administration Trump a restreint les deux modèles, estimant que les garde-fous de Fable 5 pouvaient être désactivés. Cependant, les experts soulignent que plusieurs entreprises rivales développent probablement déjà des capacités similaires. Tarah Wheeler, directrice de la sécurité du cabinet TPO Group, affirme : « C'est extrêmement myope de penser qu'aucun concurrent d'Anthropic ne développera des capacités similaires. » Logan Graham, responsable des tests adversariaux chez Anthropic, avertit qu'il faut « se préparer pour un monde où ces capacités seront largement disponibles dans 6, 12 ou 24 mois ». OpenAI a également lancé un modèle de cybersécurité en version privée en avril.

Source

arstechnica.com — Lire l'original →