OpenAI Rilis Privacy Filter untuk Deteksi Data Pribadi
Judul asli: OpenAI Privacy Filter
Mengapa Ini Penting
Memberikan infrastruktur praktis bagi developer untuk membangun AI yang aman dengan proteksi privasi tingkat enterprise
OpenAI meluncurkan Privacy Filter, model open-weight untuk mendeteksi dan menyensor informasi identitas pribadi (PII) dalam teks. Model kecil ini dapat berjalan lokal dengan performa terdepan pada benchmark PII-Masking-300k.
OpenAI Privacy Filter adalah model klasifikasi token bidirectional dengan span decoding yang dirancang untuk alur kerja privasi throughput tinggi. Model ini dapat mendeteksi PII secara sadar konteks dalam teks tidak terstruktur dan memproses input panjang secara efisien dalam satu pass. Berbeda dengan alat deteksi PII tradisional yang mengandalkan aturan deterministik, Privacy Filter menggunakan pemahaman bahasa yang lebih dalam untuk membedakan informasi publik dan pribadi. Model ini dapat berjalan lokal sehingga data tidak perlu dikirim ke server untuk de-identifikasi. OpenAI sendiri menggunakan versi fine-tuned dari Privacy Filter dalam alur kerja preservasi privasi mereka. Developer dapat menjalankan model ini di lingkungan mereka sendiri dan melakukan fine-tuning sesuai kebutuhan untuk membangun proteksi privasi yang lebih kuat.