Model AI "Berbahaya" Akan Datang Apapun Terjadi
Judul asli: "Dangerous" AI models are coming no matter what
Mengapa Ini Penting
Menunjukkan bahwa pembatasan model AI berbahaya sulit diterapkan karena kapabilitas serupa sedang dikembangkan banyak perusahaan secara paralel.
Anthropic menghentikan Claude Fable 5 dan Mythos 5 setelah direktif kontrol ekspor AS. Pakar menyatakan model AI dengan kemampuan hacking lanjutan akan menjadi norma industri dalam 6-24 bulan ke depan.
Anthropic mengambil model Claude Fable 5 dan Mythos 5 offline minggu lalu mengikuti direktif kontrol ekspor pemerintah AS yang melarang penggunaan oleh warga negara asing. Model Mythos, yang diluncurkan April lalu, memiliki kemampuan lanjutan untuk menemukan kerentanan perangkat lunak sekaligus cara mengeksploitasinya. Anthropic awalnya merilis Mythos Preview ke konsorsium terbatas melalui Project Glasswing, sementara Claude Fable 5 dirilis ke publik dengan pembatasan pada pertanyaan tentang biologi dan keamanan siber. Administrasi Trump membatasi kedua model karena khawatir guardrail Fable 5 dapat dinonaktifkan untuk akses penuh ke Mythos 5. Namun, para ahli termasuk Tarah Wheeler dari TPO Group menekankan bahwa pembatasan ini hanya menunda kenyataan: perusahaan kompetitor Anthropic dan pengembang open-weight akan mengembangkan kemampuan serupa dalam waktu dekat. Logan Graham, kepala red team frontier Anthropic, mengatakan dunia harus bersiap untuk era di mana kemampuan ini tersedia secara luas dalam 6, 12, atau 24 bulan ke depan. OpenAI juga melakukan peluncuran privat model cybersecurity pada April.