La Maison-Blanche demande à Anthropic de bloquer tous les jailbreaks
Original : The White House Wants Anthropic to Block All Jailbreaks. That May Not Be Possible
Pourquoi c'est important
Enjeu crucial pour la régulation de l'IA : tension entre sécurité gouvernementale et limites techniques des garde-fous.
L'administration Trump exige qu'Anthropic empêche le contournement des garde-fous du modèle Claude Fable 5, remis en ligne sous contrôle à l'exportation. Des experts affirment que bloquer tous les jailbreaks est techniquement impossible.
L'administration Trump et Anthropic sont en désaccord sur les modèles d'IA avancés de l'entreprise. La Maison-Blanche a informé que si Anthropic souhaite relancer Claude Fable 5, retirée en ligne en raison de préoccupations concernant les jailbreaks, l'entreprise doit résoudre les vulnérabilités alléguées. Les jailbreaks sont des méthodes utilisant des invites pour contourner les garde-fous de sécurité des modèles. Anthropic soutient que les préoccupations du gouvernement sont exagérées et que les effets des jailbreaks sont minimes. L'Agence de sécurité nationale a conclu qu'il existe des moyens de désactiver les garde-fous de Fable 5, conçus pour empêcher l'accès à des capacités liées à la cybersécurité, la chimie et la biologie. L'administration estime qu'Anthropic doit être plus proactive en testant continuellement ses modèles d'IA pour identifier les jailbreaks potentiels. Cependant, des experts en cybersécurité indépendants considèrent que les garde-fous sont temporaires, les utilisateurs compétents et les futurs modèles d'IA pouvant contourner ces restrictions.