Gedung Putih Desak Anthropic Blokir Semua Jailbreak AI
Judul asli: The White House Wants Anthropic to Block All Jailbreaks. That May Not Be Possible
Mengapa Ini Penting
Pertentangan ini menunjukkan tantangan fundamental dalam mengatur keamanan model AI frontier dan keterbatasan teknis perlindungan guardrail.
Pejabat Trump menginginkan Anthropic mengatasi kerentanan pada model Claude Fable 5 yang ditarik dari pasaran minggu lalu. Para ahli keamanan siber mengatakan mencegah semua jailbreak mungkin tidak mungkin dilakukan.
Pemerintahan Trump menuntut Anthropic mengatasi kerentanan pada model AI Fable 5 jika ingin merilis ulang model tersebut. Model ini ditarik dari peredaran minggu lalu karena kekhawatiran tentang jailbreaking—metode menggunakan prompt untuk menembus perlindungan keamanan model. Dalam pertemuan teknis dengan Departemen Perdagangan dan Kantor Direktur Siber Nasional pada Senin, Anthropic menyatakan kekhawatiran pemerintah berlebihan dan dampak jailbreak minimal. Namun, pejabat mengatakan Badan Keamanan Nasional telah menyimpulkan ada cara untuk menonaktifkan perlindungan pada Fable 5, yang dirancang mencegah akses ke kemampuan model Mythos terkait keamanan siber, kimia, dan biologi. Pemerintahan menganggap ini masalah Anthropic untuk diperbaiki. Para pejabat mengatakan Anthropic harus lebih proaktif menguji semua model AI frontier untuk menemukan jailbreak potensial dan melaporkannya ke pemerintah. Namun, ahli keamanan siber independen semakin berpandangan bahwa perlindungan pada model AI hanya solusi sementara karena pengguna terampil dan model AI masa depan akan menemukan cara menembus batasan.