UK gov's Mythos AI tests help separate cybersecurity threat from hype

Ars Technica 2026년 4월 14일

techaisecurityaisianthropic

영국 정부의 Mythos AI 테스트는 사이버 보안 위협과 과대광고를 구분하는 데 도움을 주며, Mythos 모델이 TLO(Threat Lifecycle Operation)를 처음부터 끝까지 해결하는 데 성공했습니다.

Mythos AI는 TLO 테스트에서 이전 모델들을 능가했으며, 32단계 중 평균 22단계를 완료했습니다.
Anthropic의 새로운 모델은 10번 중 3번만 성공했고, Claude 4.6은 평균 16단계를 달성했습니다.
Mythos Preview는 여전히 전력 플랜트 제어 소프트웨어의 교란 시뮬레이션인 "Cooling Tower"와 같은 더 어려운 테스트에는 어려움을 겪습니다.
1억 토큰 예산 내에서 테스트된 Mythos의 성능은 네트워크 접근이 확보된 작고 취약한 기업 시스템을 자율적으로 공격할 수 있음을 시사합니다.
그러나 AISI는 시뮬레이션된 사이버 환경이 실제 시스템의 능동적 방어 체계와 도구를 갖추고 있지 않으며, TLO 테스트는 실제 시스템에 존재하지 않을 수 있는 특정 취약점을 가지고 있다고 경고합니다.
AISI는 "잘 방어된 시스템"이 Mythos Preview의 자동화된 공격에 넘어갈 수 있는지 확실하지 않다고 밝혔습니다.
미래 모델들이 Mythos의 성능을 능가함에 따라, 시스템 보호 설계자들은 AI 모델을 활용하여 방어를 강화해야 합니다.

AI 모델의 사이버 공격 능력에 대한 Mythos AI 테스트 결과는 방어 체계 구축 시 AI 기반 공격 시나리오를 고려해야 함을 시사하며, 실제 시스템 보호를 위한 AI 활용의 필요성을 강조합니다.

원문을 불러오는 중...

GitHub Discussions

댓글