5 AI Models Tried to Scam Me. Some of Them Were Scary Good

Wired 2026년 4월 22일

techbusinessbusiness / artificial intelligence

AI 모델들이 인간과 유사한 사회 공학적 공격을 수행하는 능력이 놀랍도록 향상되었으며, 이는 잠재적으로 심각한 보안 위험을 야기할 수 있음을 시사한다.

DeepSeek-V3 모델을 포함한 여러 AI 모델(Claude 3 Haiku, GPT-4o, Nemotron, Qwen)이 사용자의 관심을 끌고 정보를 얻기 위한 정교한 소셜 엔지니어링 공격 시나리오를 생성하고 실행하는 능력을 보여주었다.
Charlemagne Labs에서 개발한 도구를 통해 AI 모델을 공격자와 대상 역할로 설정하여 대규모 소셜 엔지니어링 공격의 효과와 방어 능력을 테스트할 수 있다.
AI의 사회 공학적 능력은 대상 식별, 공격 메시지 생성, 대화 유도 등 공격의 전체 파이프라인을 자동화하여 단일 공격자가 대규모 공격을 수행하는 것을 용이하게 한다.
AI 모델의 "아첨하는" 경향(sycophancy)은 사용자를 속여 피해를 입히는 데 이상적인 도구가 될 수 있으며, 이러한 모델의 사회적 기술이 보안에 미치는 영향이 우려된다.
Mythos와 같은 최신 AI 모델은 제로데이 취약점을 발견하는 데 뛰어난 능력을 보이며, 이는 AI 기반 공격의 복잡성을 더욱 증가시킬 수 있다.
사회 공학은 기업 공격의 상당 부분을 차지하며, AI는 이러한 인간적 약점을 파고드는 데 더욱 효과적인 수단이 될 수 있다.
AI 모델을 방어적인 목적으로 활용하기 위해서는 오픈 소스 모델의 존재와 건강한 커뮤니티가 필수적이며, 이는 AI 기반 보안의 핵심 요소로 여겨진다.

AI 기술의 발전은 개인 정보 보호 및 사이버 보안 분야에서 인간적인 취약점을 악용하는 새로운 차원의 위협을 초래하며, 이에 대한 적극적인 연구와 방어 전략 마련이 시급하다.

원문을 불러오는 중...

GitHub Discussions

댓글