Anthropic’s safety warnings may have just backfired — the government has pulled the plug on its most powerful AI
개요
미국 정부는 국가 안보 우려를 이유로 Anthropic의 가장 강력한 AI 모델인 Claude Fable 5와 Claude Mythos 5에 대한 접근을 즉시 차단하라고 명령했으며, Anthropic은 이에 협조했지만 정부의 결정에 동의하지 않음을 표명했습니다.
주요 내용
* 정부의 모델 차단 명령: 미국 정부는 Anthropic에 Claude Fable 5와 Claude Mythos 5 모델의 전 세계 사용자 접근을 즉시 중단할 것을 명령했으며, 이는 명목상 외국인의 모델 접근을 제한하려는 수출 통제 조치에 해당합니다.
* Claude Mythos 5의 능력: Mythos는 Anthropic의 가장 유능한 AI 모델로, 소프트웨어 보안 취약점을 발견하는 데 탁월한 능력을 보였습니다. Anthropic은 이를 통제된 프로그램인 Project Glasswing을 통해 50여 개의 검증된 조직에만 제공했습니다.
* Claude Fable 5의 출시와 정부의 우려: Fable 5는 Mythos를 기반으로 하되, 사이버 보안 및 생물학 등 고위험 영역에서의 답변을 차단하는 안전 장치를 갖춰 일반 공개를 목표로 출시되었습니다. 그러나 정부는 Fable 5의 "잠재적이고 제한적인 탈옥(jailbreak)" 가능성을 우려하며 차단 명령을 내린 것으로 보입니다.
* Anthropic의 반박: Anthropic은 정부가 제시한 탈옥 사례가 특정 코드베이스를 읽고 소프트웨어 결함을 식별하는 수준으로, 이는 GPT-5.5 등 다른 공개 모델에서도 가능한 수준이며 사이버 보안 전문가들이 방어 목적으로 일상적으로 사용하는 능력이라고 주장합니다. 또한, Anthropic은 독립적인 분류 시스템이 모델 자체와 분리되어 작동하기 때문에 탈옥이 발생해도 핵심적인 보호 장치는 유지된다고 설명합니다.
* Anthropic의 입장: Anthropic은 제한적인 잠재적 탈옥 발견이 수억 명에게 배포된 상용 모델을 회수할 사유가 될 수 없으며, 이러한 기준이 업계 전반에 적용된다면 모든 최첨단 모델 제공업체의 신규 모델 배포가 중단될 것이라고 반박했습니다.
* 전략적 아이러니: 안전을 강조하며 Mythos 모델의 위험성을 알렸던 Anthropic의 접근 방식이 오히려 정부의 면밀한 조사를 촉발하여 사업에 차질을 빚을 수 있다는 아이러니가 제기됩니다.
시사점
Anthropic의 안전 중심 접근 방식이 오히려 정부의 엄격한 규제를 불러올 수 있으며, 이는 AI 모델의 공개 및 배포 전략에 대한 복합적인 고려가 필요함을 시사합니다.
댓글
GitHub Discussions