OpenAI、ChatGPTの画像生成モデルを大幅強化
原題: OpenAI Beefs Up ChatGPT’s Image Generation Model
なぜ重要か
AI画像生成技術の進歩により、多言語対応と複数画像生成が実現し、クリエイティブ業界での活用範囲が大幅拡大する意義がある。
OpenAIは火曜日に新しい画像生成AIモデル「ChatGPT Images 2.0」を発表した。1つのプロンプトから複数画像を生成でき、中国語やヒンディー語などの非英語テキストも出力可能。ChatGPTとCodexユーザー向けに全世界で提供開始、有料版ではより強力な機能が利用できる。
OpenAIが発表したChatGPT Images 2.0は、従来モデルと比べて大幅な機能向上を実現している。新モデルはChatGPTの「推論」機能を活用し、インターネットから最新情報を検索して複数の画像を同時生成できる。知識のカットオフ日は2025年12月に更新され、より詳細で粒度の高い画像出力が可能になった。テスト結果では、サンフランシスコの翌日の天気予報と観光アクティビティを含むインフォグラフィックを生成し、雨の日の正確な天気詳細とフェリービルディング、カストロシアター、ペインテッドレディース、トランスアメリカピラミッドの正確な描画を含んでいた。新モデルは3:1の横長から1:3の縦長まで多様なアスペクト比に対応し、ユーザーがプロンプト内でサイズ調整を指定できる。英語でのテキスト描画能力は特に向上しており、以前の文字化けや余分な文字の問題が大幅に改善された。非英語での出力テストでは、ティモシー・シャラメをテーマにした中国語ファン向けコラージュポスターを生成し、20以上のテキスト断片と餃子、タピオカ、パンダの画像を含む詳細なAIコラージュを作成した。