DeepSeek V4 Flash untuk Metal Diluncurkan sebagai Engine Inferensi

Judul asli: DeepSeek 4 Flash local inference engine for Metal

Mengapa Ini Penting

Optimisasi khusus untuk DeepSeek V4 Flash dapat meningkatkan adopsi AI lokal

Antirez merilis ds4, engine inferensi native untuk DeepSeek V4 Flash yang dioptimalkan khusus untuk Metal. Engine ini fokus pada eksekusi graph Metal dengan loading DS4-spesifik dan API server.

Developer Antirez meluncurkan ds4.c, engine inferensi native yang dirancang khusus untuk model DeepSeek V4 Flash. Berbeda dari GGUF runner generik, ds4 merupakan executor graph Metal yang dioptimalkan untuk DS4 dengan fitur loading khusus, prompt rendering, KV state management, dan API server terintegrasi. Proyek ini terinspirasi dari llama.cpp dan GGML karya Georgi Gerganov. Repository GitHub menunjukkan 1.6k stars dan 92 forks, mencerminkan antusiasme komunitas developer. Engine ini dikembangkan dengan pendekatan minimalis namun fokus pada performa optimal untuk model DeepSeek V4 Flash di platform Metal.

Sumber

github.com — Baca artikel asli →