GLM-5.2 : exécuter localement avec Unsloth

Original : GLM-5.2 – How to Run Locally

Pourquoi c'est important

GLM-5.2 démocratise l'accès aux modèles avancés en permettant l'exécution locale sur matériel courant.

Unsloth permet d'exécuter GLM-5.2, le nouveau modèle ouvert de Z.ai, sur du matériel local. Avec 744 milliards de paramètres et une fenêtre de contexte d'un million de tokens, le modèle peut être quantifié en 1 à 8 bits, nécessitant entre 223 et 810 Go de mémoire.

GLM-5.2 est le nouveau modèle open-source de Z.ai offrant des performances de pointe en codage longue portée, raisonnement et tâches agentic. Avec 744 milliards de paramètres totaux et 40 milliards de paramètres actifs, il affiche des résultats comparables à Claude 4.8 Opus, GPT-5.5 et Gemini 3.1 Pro selon les benchmarks Artificial Analysis. Unsloth propose des quantifications dynamiques GGUFs permettant son exécution locale : la version 1-bit atteint 76,2% de précision avec une réduction de 86%, tandis que la version 2-bit atteint 82% de précision avec une réduction de 84%. La version 2-bit nécessite 239 Go de stockage disque, compatible avec les MacBook 256 Go et les GPU 24 Go. GLM-5.2 supporte trois modes de réflexion : non-réflexion, réflexion haute et maximale. Les exigences mémoire varient de 223 Go (1-bit) à 810 Go (8-bit). Unsloth Studio offre une interface utiliselle pour basculer les paramètres de réflexion et de configuration.

Source

unsloth.ai — Lire l'original →