An update on recent Claude Code quality reports

개요

Claude Code의 최근 품질 저하 보고에 대해 Anthropic은 세 가지 별개의 변경 사항이 Claude Code, Claude Agent SDK 및 Claude Cowork에 영향을 미쳤음을 확인했으며, 현재 이 문제들은 모두 해결되었습니다.

주요 내용

* Claude Code의 기본 추론 노력(Reasoning Effort) 변경:
* 기존에 높은 응답 지연 시간을 줄이기 위해 '높음(high)'에서 '중간(medium)'으로 기본 추론 노력을 변경했으나, 사용자들은 더 높은 지능을 선호하여 4월 7일에 이전 설정으로 되돌렸습니다. (Sonnet 4.6, Opus 4.6 영향)
* 세션 재개 시 이전 추론 기록 삭제 버그:
* 1시간 이상 비활성 상태였던 세션의 이전 추론 기록을 삭제하여 지연 시간을 줄이려 했으나, 버그로 인해 세션 내내 매 턴마다 기록이 삭제되어 Claude가 마치 이전 내용을 잊고 반복하는 것처럼 보이게 되었습니다. 이 문제는 4월 10일에 수정되었습니다. (Sonnet 4.6, Opus 4.6 영향)
* 말줄임(Verbosity) 감소를 위한 시스템 프롬프트 변경:
* 응답의 상세함을 줄이기 위한 시스템 프롬프트 변경이 다른 프롬프트 변경과 결합되어 코딩 품질에 부정적인 영향을 미쳤고, 4월 20일에 되돌려졌습니다. (Sonnet 4.6, Opus 4.6, Opus 4.7 영향)
* API는 영향받지 않았으며, 모든 문제는 4월 20일(v2.1.116)부로 해결되었습니다.
* 향후 개선 계획:
* 내부 직원이 공개 빌드를 더 많이 사용하도록 하고, 내부 Code Review 도구를 개선하여 사용자에게도 제공합니다.
* 시스템 프롬프트 변경에 대한 통제를 강화하고, 광범위한 평가와 점진적 출시를 통해 문제를 조기에 발견할 것입니다.
* 모델별 변경 사항은 해당 모델에만 적용되도록 게이트를 설정합니다.
* 지능과 상충될 수 있는 변경 사항에는 충분한 기간, 광범위한 평가, 점진적 출시를 적용합니다.
* 사용자 피드백 및 조치:
* 문제를 보고하고 구체적인 예시를 제공한 사용자들에게 감사하며, 4월 23일부로 모든 구독자의 사용량 제한을 초기화합니다.

시사점

이번 사례는 모델 개발 과정에서 발생할 수 있는 예기치 못한 부작용과 그 해결 과정을 보여주며, 사용자 피드백의 중요성과 시스템 변경 시의 신중한 검증 절차의 필요성을 강조합니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions