OpenAI, ChatGPT 이미지 생성 모델 대폭 업그레이드

원제: OpenAI Beefs Up ChatGPT’s Image Generation Model

왜 중요한가

AI 이미지 생성 기술의 다국어 지원과 복합 출력 기능 향상으로 창작 도구 시장 경쟁이 가속화될 전망이다.

OpenAI가 화요일 ChatGPT Images 2.0 모델을 출시했다. 새 모델은 단일 프롬프트로 여러 이미지를 생성하고, 중국어와 힌디어 등 비영어권 언어로 텍스트를 출력할 수 있다. 전 세계 ChatGPT 및 Codex 사용자에게 제공되며, 유료 구독자는 더 강력한 버전을 이용할 수 있다.

새로운 ChatGPT Images 2.0 모델은 ChatGPT의 '추론' 기능을 활용해 인터넷에서 최신 정보를 검색하고 한 번의 프롬프트로 여러 이미지를 생성할 수 있다. 지식 기준일이 2025년 12월로 업데이트되어 더욱 세밀한 결과물을 제공한다. 테스터는 샌프란시오 날씨 예보와 추천 활동이 포함된 인포그래픽을 생성했는데, 정확한 날씨 정보와 페리 빌딩, 카스트로 극장 등 랜드마크 그림이 포함되었다. 새 모델은 3:1 와이드부터 1:3 세로까지 다양한 종횡비를 지원하며, 사용자가 프롬프트에서 이미지 크기를 조정할 수 있다. 영어 텍스트 렌더링 성능이 크게 향상되어 이전 모델들이 보였던 잘못된 문자나 추가 문자 문제가 해결되었다. 중국어 등 다른 언어에서는 여전히 어려움이 있으나, 전반적으로 텍스트가 포함된 복잡한 이미지 생성에서 지속적인 개선을 보여주고 있다.

출처

wired.com — 원문 읽기 →