GLM-5.2 Dapat Dijalankan Secara Lokal dengan Unsloth
Judul asli: GLM-5.2 – How to Run Locally
Mengapa Ini Penting
GLM-5.2 membuat model berkinerja tinggi dapat diakses untuk menjalankan secara lokal, mengurangi ketergantungan pada API cloud sambil mempertahankan kualitas inference.
Z.ai meluncurkan GLM-5.2, model open-source dengan 744 miliar parameter yang dapat dijalankan di perangkat lokal menggunakan Unsloth Dynamic GGUFs. Model dengan jendela konteks 1 juta token ini mencapai performa setara Claude Opus, GPT-5.5, dan Gemini 3.1 Pro.
GLM-5.2 adalah model open-source terbaru dari Z.ai yang dirancang untuk menangani tugas coding jangka panjang, reasoning, dan agentic dengan performa tinggi. Model berukuran 744 miliar parameter ini memiliki 40 miliar parameter aktif dan jendela konteks 1 juta token.
Unsloth telah mengoptimalkan GLM-5.2 melalui teknologi Dynamic GGUFs, memungkinkan kuantisasi yang efisien. Versi 1-bit Dynamic mencapai akurasi 76,2 persen dengan ukuran 86 persen lebih kecil, sementara versi 2-bit mencapai 82 persen akurasi dengan ukuran 84 persen lebih kecil. Persyaratan memori untuk menjalankan model bervariasi: 1-bit memerlukan 223GB RAM, 2-bit memerlukan 245GB, dan 8-bit memerlukan 810GB.
Model ini mendukung tiga mode thinking: non-thinking, thinking tinggi, dan thinking maksimal. Pengguna dapat mengonfigurasi temperature, top_p, dan reasoning effort sesuai kebutuhan tugas. GLM-5.2 menunjukkan performa yang sebanding dengan model-model proprietary terkemuka berdasarkan benchmark Artificial Analysis dan lainnya.