開発ツール・SaaS 6月13日 ikyle.me

macOSでローカルコーディングエージェント構築方法

原題: How to setup a local coding agent on macOS

なぜ重要か

ローカル環境でのAIコーディングエージェント実装により、プライバシー保護と可用性向上を両立する開発環境構築手法として注目

Kyle Howells氏がmacOS上でGemma 4 26B-A4BとQwen3.6 35B-A3Bを使用したローカルコーディングエージェントのセットアップ方法を公開。llama.cpp、MTP投機的デコーディング、マルチモーダル対応、Piエージェントを組み合わせ、OpenAI互換APIで動作。Apple M1 Max 64GBメモリ環境でテスト実施。

開発者のKyle Howells氏は、インターネット障害時でも使用可能なローカルコーディングエージェントのセットアップ方法を詳細に解説した。システムは高速動作、OpenAI互換API、スクリーンショット対応の3つの要件を満たすよう設計された。

構成要素は、macOS上でMetalを使用したllama.cpp、GGUF形式のGemma 4 26B-A4B、投機的デコーディング用Q8 MTGドラフトモデル、Gemma 4マルチモーダルプロジェクター、ターミナルコーディングエージェントのPiとなっている。

性能テストでは、Apple M1 Max 64GB統合メモリ、macOS 15.7.7環境で実施。メインモデル単体では58.2トークン/秒だったが、Q8 MTGドラフトモデル追加により72.2トークン/秒まで向上し、24%の高速化を達成した。

最適化では、--spec-draft-n-maxパラメータを1から6まで調整し、値3で最高性能を記録。モデルサイズは約16GBで、MTGドラフトヘッドとマルチモーダルプロジェクター含めて合計17GBとなった。リアルタイム動画でエージェントが実用的な速度で応答する様子も公開されている。

出典

ikyle.me — 元記事を読む →

macOSでローカルコーディングエージェント構築方法

なぜ重要か

出典

関連記事

ログインして聴く