Les modèles IA dangereux arrivent inévitablement
Original : ‘Dangerous’ AI Models Are Coming No Matter What
Pourquoi c'est important
Illustre l'inefficacité des restrictions réglementaires face à la prolifération rapide des capacités d'IA à double usage.
Le gouvernement américain a ordonné à Anthropic de retirer ses modèles Claude Fable 5 et Mythos 5 en raison de capacités avancées de piratage. Experts avertissent que d'autres entreprises développent déjà des modèles similaires, rendant la restriction inefficace.
Anthropic a désactivé ses modèles d'IA Claude Fable 5 et Mythos 5 suite à un ordre d'export-control du gouvernement américain interdisant l'accès aux ressortissants étrangers. L'administration Trump considère que les garde-fous de Fable 5 peuvent être contournés pour accéder aux capacités complètes de Mythos 5, posant un risque de sécurité nationale. Depuis son lancement en avril, Mythos affiche des capacités avancées pour identifier et exploiter les vulnérabilités logicielles. Anthropic a d'abord distribué une version restreinte à un consortium privé via Project Glasswing, puis a lancé Claude Fable 5 au public avec des blocages spécifiques concernant la biologie et la cybersécurité. Cependant, les experts en sécurité, dont Tarah Wheeler (directrice de la sécurité chez TPO Group), avertissent que cette restriction ne fait que retarder l'inévitable. Ils notent que d'autres entreprises, notamment OpenAI qui a lancé un modèle cybersécurité similaire en avril, développent probablement des capacités équivalentes et attendent l'évolution du contexte réglementaire. Anthropic elle-même a déclaré que ces capacités seraient largement disponibles dans 6 à 24 mois.