PrismML, 모바일 기기용 1비트 이미지 생성 모델 공개

원제: 1-Bit Bonsai Image 4B Image Generation for Local Devices

왜 중요한가

모바일 기기에서 직접 실행 가능한 고품질 이미지 생성 모델로 온디바이스 AI의 새로운 가능성을 제시한다.

PrismML이 1비트와 삼진법 Bonsai Image 4B 모델을 발표했다. iPhone에서 직접 실행 가능한 초소형 이미지 생성 모델로, 원본 FLUX.2 Klein 4B 대비 메모리 사용량을 8.3배 줄였다. 1비트 버전은 0.93GB, 삼진법 버전은 1.21GB 크기다.

PrismML이 로컬 디바이스에서 실행 가능한 초소형 이미지 생성 모델인 'Bonsai Image 4B'를 출시했다고 발표했다. 이 모델은 1비트와 삼진법 두 가지 버전으로 제공된다.

1비트 Bonsai Image 4B는 이진법 {-1, +1} 트랜스포머 가중치와 FP16 그룹별 스케일링 팩터를 사용해 가중치당 1.125 유효 비트를 구현한다. 메모리 압박과 대역폭 제약이 주요 고려사항일 때 적합하다. 삼진법 Bonsai Image 4B는 {-1, 0, +1} 트랜스포머 가중치를 사용해 가중치당 1.71 유효 비트를 제공하며, 0 상태 추가로 시각적 품질과 프롬프트 충실도가 개선된다.

메모리 사용량 면에서 1비트 버전의 트랜스포머는 0.93GB로 원본 FLUX.2 Klein 4B의 7.75GB 대비 8.3배 감소했다. 삼진법 버전은 1.21GB로 6.4배 감소를 달성했다. Apple Silicon 배포 페이로드는 1비트가 3.42GB, 삼진법이 3.88GB인 반면 원본은 15.97GB다. 512x512 이미지 생성 시 평균 활성 메모리는 1비트가 1.5GB, 삼진법이 1.96GB로 원본의 11.74GB 대비 각각 7.8배, 6.0배 감소했다.

출처

prismml.com — 원문 읽기 →