OpenAI Codex system prompt includes explicit directive to "never talk about goblins"

개요

OpenAI Codex CLI의 최신 GPT 모델에 대한 시스템 프롬프트에 "고블린에 대해 절대 말하지 말라"는 지침이 명시적으로 포함되어 있으며, 이는 이전 모델에서는 발견되지 않은 새로운 문제에 대한 대응으로 보인다.

주요 내용

* OpenAI Codex CLI의 최신 GPT 모델 시스템 프롬프트에 "고블린, 그렘린, 너구리, 트롤, 오거, 비둘기 또는 기타 동물이나 생물을 사용자의 질문과 절대적으로 명확하게 관련이 없는 한 절대로 언급하지 말라"는 경고가 포함되어 있다.
* 이러한 지침은 최근 공개된 GPT-5.5의 3,500단어 이상의 "기본 지침"에 두 번 반복되어 나타나며, "이모티콘이나 대시를 사용하지 말라" 또는 "사용자가 명확히 요청하지 않는 한 'git reset --hard'와 같은 파괴적인 명령을 사용하지 말라"는 내용과 함께 제시된다.
* 이전 모델에 대한 시스템 프롬프트에는 이러한 특정 금지 조항이 포함되어 있지 않아, OpenAI는 최신 모델 출시에서 새롭게 발생한 문제에 대응하고 있음을 시사한다.
* 소셜 미디어에서는 일부 사용자들이 GPT가 무관한 대화에서 고블린에 집중하는 경향에 대해 불평하고 있다는 경험적 증거가 있다.
* Codex 개발자인 OpenAI 직원 Nick Pash는 이것이 GPT-5.5와 Codex에 대한 홍보 전략이 아니라고 주장했다.
* OpenAI CEO Sam Altman은 소셜 미디어에서 이 상황을 언급하며 "이것은 마케팅 수법이 아니다. 나는 고블린의 순간을 의미했다. 미안하다"라고 말했다.

시사점

OpenAI Codex의 최신 모델에서 특정 동물이나 생물에 대한 과도한 언급을 방지하기 위한 시스템 프롬프트 수정은, AI 모델의 예측 불가능한 행동을 제어하고 사용자 경험을 개선하려는 노력을 보여준다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions