Model AI 'Berbahaya' akan Segera Hadir

Judul asli: ‘Dangerous’ AI Models Are Coming No Matter What

Mengapa Ini Penting

Menunjukkan bahwa pembatasan model AI khusus tidak mampu menghentikan penyebaran teknologi berbahaya karena persaingan industri dan pengembangan open-source.

Pemerintah AS mengarahkan Anthropic mengambil offline model Claude Fable 5 dan Mythos 5 karena kekhawatiran keamanan nasional. Namun para ahli meyakini model AI dengan kemampuan hacking lanjutan dari berbagai perusahaan akan menjadi norma dalam 6-24 bulan ke depan.

Minggu lalu, Anthropic mengambil offline model Claude Fable 5 dan Mythos 5 setelah pemerintah AS mengeluarkan direktif kontrol ekspor yang melarang "warga negara asing" menggunakan layanan tersebut. Perusahaan masih dalam negosiasi dengan Gedung Putih untuk mencapai kesepakatan reinstatement. Anthropic telah menekankan bahwa Mythos memiliki kemampuan lanjutan untuk menemukan kerentanan perangkat lunak sekaligus cara mengeksploitasinya—keduanya bisa digunakan untuk pertahanan dan serangan siber. Model Mythos 5 dirilis secara terbatas kepada konsorsium khusus melalui Project Glasswing, sementara Claude Fable 5 dirilis ke publik dengan pembatasan pada pertanyaan biologi dan keamanan siber. Administrasi Trump membatasi kedua model karena percaya guardrail Fable 5 bisa dinonaktifkan untuk akses penuh ke Mythos 5. Namun para ahli keamanan siber seperti Tarah Wheeler dari TPO Group mengatakan pembatasan ini hanya menunda kenyataan keras: perusahaan kompetitor Anthropic kemungkinan sudah mengembangkan atau sedang memegang kemampuan serupa sambil menunggu lingkungan regulasi berkembang. Logan Graham, frontier red team lead Anthropic, sebelumnya menyatakan perlu persiapan untuk dunia di mana kemampuan ini tersedia secara luas dalam 6-24 bulan. OpenAI juga melakukan rilis privat model keamanan siber di April dan mengumumkan strategi keamanan siber yang diperluas.

Sumber

wired.com — Baca artikel asli →