Guide : configurer un agent de codage local sur macOS

Original : How to setup a local coding agent on macOS

Pourquoi c'est important

Démocratise l'accès aux agents de codage IA en local sans dépendance Internet

Kyle Howells explique comment installer un agent de codage local sur macOS en utilisant llama.cpp, Gemma 4 26B-A4B et le décodage spéculatif MTP pour atteindre 72,2 tokens/seconde sur M1 Max avec 64 GB de mémoire.

L'auteur présente une configuration complète pour faire fonctionner un agent de codage local rapide : llama.cpp avec accélération Metal, le modèle Gemma 4 26B-A4B en format GGUF (16 GB), un modèle draft Q8 MTP pour le décodage spéculatif, et Pi comme agent terminal. Les benchmarks montrent une amélioration de 24% des performances de génération (58,2 à 72,2 tokens/seconde) grâce au MTP avec 3 tokens draft optimaux. Le système supporte une API compatible OpenAI et la gestion d'images/captures d'écran. La configuration nécessite macOS 15.7.7 et fonctionne efficacement sur Apple M1 Max.

Source

ikyle.me — Lire l'original →