OpenAI claims ChatGPT’s new default model hallucinates way less
개요
OpenAI의 최신 기본 모델인 GPT-5.5 Instant은 환각(hallucination) 현상을 크게 줄이고 전반적인 사실성을 향상시켰다고 주장합니다.
주요 내용
* GPT-5.5 Instant 모델은 이전 GPT-5.3 Instant 모델 대비 의학, 법률, 금융 등 고위험 질문에서 52.5% 더 적은 환각적 주장을 생성했다고 OpenAI는 자체 평가를 통해 밝혔습니다.
* 특히 사용자가 사실 오류로 신고한 까다로운 대화에서는 부정확한 주장을 37.3% 감소시켰습니다.
* GPT-5.5 Instant은 이미지 분석, 웹 검색 필요성 인지 등 일상적인 작업에서도 향상된 능력을 보이며, 더 간결하고 핵심적인 답변을 제공하고 불필요한 이모티콘 사용을 피합니다.
* 이전 대화나 Gmail 등의 맥락을 더 효과적으로 활용하여 개인 맞춤형 응답을 제공하며, 이는 Google의 Gemini가 투자하는 기능과 유사합니다.
* 모든 ChatGPT 모델에 새로운 "메모리 소스(memory sources)" 기능이 추가되어 챗봇이 어떤 맥락을 기반으로 개인 맞춤형 응답을 제공했는지 보여주며, 사용자는 이 정보를 삭제하거나 수정할 수 있습니다.
* GPT-5.5 Instant은 화요일부터 모든 ChatGPT 사용자에게 점진적으로 배포될 예정이며, GPT-5.3 Instant은 3개월 동안 옵션으로 제공된 후 지원이 중단될 예정입니다.
* 향상된 개인 맞춤 기능은 웹의 Plus 및 Pro 사용자에게 먼저 제공되며, 모바일 앱에도 곧 출시될 예정입니다. 무료, Go, Business, Enterprise 사용자에게도 곧 제공될 계획입니다.
* 메모리 소스 기능은 현재 웹의 ChatGPT 소비자 플랜에 배포 중이며, 곧 모바일에서도 사용할 수 있습니다.
시사점
GPT-5.5 Instant의 환각 감소 및 사실성 향상은 AI 모델의 신뢰성을 높여 의학, 법률, 금융과 같은 중요한 분야에서의 활용 가능성을 넓히며, 개인 맞춤형 응답과 투명한 맥락 제공 기능은 사용자 경험을 더욱 개선할 것으로 기대됩니다.
댓글
GitHub Discussions