UK gov's Mythos AI tests help separate cybersecurity threat from hype

개요

영국 정부의 Mythos AI 테스트는 사이버 보안 위협과 과대광고를 구분하는 데 도움을 주며, Mythos 모델이 TLO(Threat Lifecycle Operation)를 처음부터 끝까지 해결하는 데 성공했습니다.

주요 내용

  • Mythos AI는 TLO 테스트에서 이전 모델들을 능가했으며, 32단계 중 평균 22단계를 완료했습니다.
  • Anthropic의 새로운 모델은 10번 중 3번만 성공했고, Claude 4.6은 평균 16단계를 달성했습니다.
  • Mythos Preview는 여전히 전력 플랜트 제어 소프트웨어의 교란 시뮬레이션인 "Cooling Tower"와 같은 더 어려운 테스트에는 어려움을 겪습니다.
  • 1억 토큰 예산 내에서 테스트된 Mythos의 성능은 네트워크 접근이 확보된 작고 취약한 기업 시스템을 자율적으로 공격할 수 있음을 시사합니다.
  • 그러나 AISI는 시뮬레이션된 사이버 환경이 실제 시스템의 능동적 방어 체계와 도구를 갖추고 있지 않으며, TLO 테스트는 실제 시스템에 존재하지 않을 수 있는 특정 취약점을 가지고 있다고 경고합니다.
  • AISI는 "잘 방어된 시스템"이 Mythos Preview의 자동화된 공격에 넘어갈 수 있는지 확실하지 않다고 밝혔습니다.
  • 미래 모델들이 Mythos의 성능을 능가함에 따라, 시스템 보호 설계자들은 AI 모델을 활용하여 방어를 강화해야 합니다.

시사점

AI 모델의 사이버 공격 능력에 대한 Mythos AI 테스트 결과는 방어 체계 구축 시 AI 기반 공격 시나리오를 고려해야 함을 시사하며, 실제 시스템 보호를 위한 AI 활용의 필요성을 강조합니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions