PrismMLが1ビット画像生成AI「Bonsai Image 4B」を発表

原題: 1-Bit Bonsai Image 4B Image Generation for Local Devices

なぜ重要か

AI画像生成の民主化を進める技術革新で、高性能モデルのモバイル展開が現実的となる。

AI企業PrismMLは5月26日、ローカルデバイス向けの軽量画像生成モデル「Bonsai Image 4B」を発表した。1ビット版は0.93GB、3値版は1.21GBで、従来のFLUX.2 Klein 4Bの7.75GBから大幅にサイズを削減。iPhoneでの動作も可能となった。

PrismMLが発表したBonsai Image 4Bは、ローカルハードウェアでの高品質な拡散推論を目的とした画像生成モデルファミリー。1ビット版と3値版の2つの変種を提供する。1ビット版は{-1, +1}のバイナリ重みとFP16グループ別スケーリング係数を使用し、実効1.125ビット/重みを実現。メモリ容量、帯域幅、展開フットプリントが主要制約の場合に最適化されている。3値版は{-1, 0, +1}の重みを使用し、実効1.71ビット/重みで、追加のゼロ状態により表現力を向上させ、視覚品質とプロンプト忠実性を改善。FLUX.2 Klein 4Bをベースとし、アーキテクチャはそのままに重みの表現方法を変更。1ビット版の拡散変換器は0.93GBで元の7.75GBから8.3倍削減、3値版は1.21GBで6.4倍削減を実現。Apple Silicon展開ペイロードは1ビット版3.42GB、3値版3.88GBで、原版の15.97GBと比較して大幅に縮小。512x512画像生成時の平均アクティブメモリは1ビット版1.5GB、3値版1.96GBで、原版の11.74GBから7.8倍と6.0倍の削減を達成。

出典

prismml.com — 元記事を読む →