Guide : configurer un agent de codage local sur macOS
Original : How to setup a local coding agent on macOS
Pourquoi c'est important
Démocratise l'accès aux agents de codage IA en local sans dépendance Internet
Kyle Howells explique comment installer un agent de codage local sur macOS en utilisant llama.cpp, Gemma 4 26B-A4B et le décodage spéculatif MTP pour atteindre 72,2 tokens/seconde sur M1 Max avec 64 GB de mémoire.
L'auteur présente une configuration complète pour faire fonctionner un agent de codage local rapide : llama.cpp avec accélération Metal, le modèle Gemma 4 26B-A4B en format GGUF (16 GB), un modèle draft Q8 MTP pour le décodage spéculatif, et Pi comme agent terminal. Les benchmarks montrent une amélioration de 24% des performances de génération (58,2 à 72,2 tokens/seconde) grâce au MTP avec 3 tokens draft optimaux. Le système supporte une API compatible OpenAI et la gestion d'images/captures d'écran. La configuration nécessite macOS 15.7.7 et fonctionne efficacement sur Apple M1 Max.