OpenAI claims ChatGPT’s new default model hallucinates way less

개요

OpenAI의 최신 기본 모델인 GPT-5.5 Instant은 환각(hallucination) 현상을 크게 줄이고 전반적인 사실성을 향상시켰다고 주장합니다.

주요 내용

* GPT-5.5 Instant 모델은 이전 GPT-5.3 Instant 모델 대비 의학, 법률, 금융 등 고위험 질문에서 52.5% 더 적은 환각적 주장을 생성했다고 OpenAI는 자체 평가를 통해 밝혔습니다.
* 특히 사용자가 사실 오류로 신고한 까다로운 대화에서는 부정확한 주장을 37.3% 감소시켰습니다.
* GPT-5.5 Instant은 이미지 분석, 웹 검색 필요성 인지 등 일상적인 작업에서도 향상된 능력을 보이며, 더 간결하고 핵심적인 답변을 제공하고 불필요한 이모티콘 사용을 피합니다.
* 이전 대화나 Gmail 등의 맥락을 더 효과적으로 활용하여 개인 맞춤형 응답을 제공하며, 이는 Google의 Gemini가 투자하는 기능과 유사합니다.
* 모든 ChatGPT 모델에 새로운 "메모리 소스(memory sources)" 기능이 추가되어 챗봇이 어떤 맥락을 기반으로 개인 맞춤형 응답을 제공했는지 보여주며, 사용자는 이 정보를 삭제하거나 수정할 수 있습니다.
* GPT-5.5 Instant은 화요일부터 모든 ChatGPT 사용자에게 점진적으로 배포될 예정이며, GPT-5.3 Instant은 3개월 동안 옵션으로 제공된 후 지원이 중단될 예정입니다.
* 향상된 개인 맞춤 기능은 웹의 Plus 및 Pro 사용자에게 먼저 제공되며, 모바일 앱에도 곧 출시될 예정입니다. 무료, Go, Business, Enterprise 사용자에게도 곧 제공될 계획입니다.
* 메모리 소스 기능은 현재 웹의 ChatGPT 소비자 플랜에 배포 중이며, 곧 모바일에서도 사용할 수 있습니다.

시사점

GPT-5.5 Instant의 환각 감소 및 사실성 향상은 AI 모델의 신뢰성을 높여 의학, 법률, 금융과 같은 중요한 분야에서의 활용 가능성을 넓히며, 개인 맞춤형 응답과 투명한 맥락 제공 기능은 사용자 경험을 더욱 개선할 것으로 기대됩니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions