macOS पर लोकल कोडिंग एजेंट सेटअप गाइड

मूल शीर्षक: How to setup a local coding agent on macOS

यह क्यों महत्वपूर्ण है

लोकल AI कोडिंग एजेंट्स डेवलपर्स को इंटरनेट dependency के बिना तेज़ असिस्टेंस देते हैं।

Kyle Howells ने macOS पर Gemma 4 26B-A4B और Qwen3.6 35B-A3B मॉडल के साथ llama.cpp का उपयोग करके लोकल कोडिंग एजेंट सेटअप किया। MTP speculative decoding से 24% गति वृद्धि हासिल की गई।

डेवलपर Kyle Howells ने Apple M1 Max (64GB RAM) पर तेज़ लोकल कोडिंग एजेंट का सफल सेटअप किया है। मुख्य कॉम्पोनेंट्स में llama.cpp with Metal acceleration, Gemma 4 26B-A4B मॉडल (16GB GGUF format), Q8 MTP draft model for speculative decoding, और Pi terminal coding agent शामिल हैं। बेसलाइन टेस्ट में मॉडल ने 58.2 tokens/second की गति दी। MTP draft model जोड़ने के बाद यह 72.2 tokens/second तक पहुंच गया - 24% की सुधार। टेस्टिंग में --spec-draft-n-max की value 3 सबसे optimal साबित हुई। सिस्टम में OpenAI compatible API और multimodal support भी है, जो screenshots को प्रोसेस कर सकती है। यह सेटअप इंटरनेट कनेक्शन के बिना भी काम करता है और real-time coding assistance प्रदान करता है।

स्रोत

ikyle.me — मूल लेख पढ़ें →