OpenAI Beefs Up ChatGPT’s Image Generation Model

개요

OpenAI가 ChatGPT의 이미지 생성 AI 모델을 ChatGPT Images 2.0으로 업데이트하여, 하나의 프롬프트로 여러 개의 이미지를 생성하고 텍스트 출력 및 다국어 지원 기능을 강화했습니다.

주요 내용

  • 향상된 생성 능력: ChatGPT Images 2.0은 ChatGPT의 "추론" 기능을 활용하여 인터넷에서 최신 정보를 검색하고, 단일 프롬프트로 스터디 북과 같이 여러 이미지 또는 텍스트를 포함한 결과물을 생성할 수 있습니다.
  • 최신 지식: 모델의 지식 마감일이 2025년 12월로 업데이트되어 더 최근의 정보를 반영한 이미지를 생성할 수 있습니다.
  • 세부적인 결과물: 샌프란시스코 날씨 예보와 활동 정보를 담은 인포그래픽을 생성한 결과, 정확한 날씨 정보와 함께 주요 랜드마크를 묘사한 이미지가 포함되었습니다.
  • 사용자 맞춤 설정: 이미지의 종횡비(3:1에서 1:3까지)를 사용자가 조절할 수 있으며, 프롬프트 내에서 이미지 크기를 조정할 수 있습니다.
  • 텍스트 렌더링 개선: 영어 텍스트가 포함된 이미지 생성에서 이전 모델 대비 명확하고 복잡한 텍스트를 더 잘 처리하며, 정확도가 향상되었습니다.
  • 다국어 텍스트 생성 및 검증: 중국어와 힌디어 등 비영어권 언어 텍스트 생성이 가능해졌으나, 실제 생성된 중국어 텍스트는 일부 부정확하거나 번역이 어려운 "가짜" 또는 "밈" 스타일의 AI 텍스트가 포함될 수 있다는 점이 자체 검증을 통해 확인되었습니다.

시사점

ChatGPT Images 2.0의 업데이트는 이미지 생성 AI의 사용자 경험을 향상시키고, 특히 텍스트와 다국어 생성 능력 개선을 통해 글로벌 사용자들의 다양한 요구를 충족시킬 잠재력을 보여줍니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions