Trump plan to test AI models has a problem—US security teams were gutted by DOGE

Ars Technica 2026년 6월 3일

techaipolicyai safetyai safety testing

개요

트럼프 행정부의 AI 모델 테스트 계획은 미국 보안 팀의 역량 약화라는 문제와 AI 모델의 투명성 부족으로 인해 그 효과가 제한될 수 있다는 우려가 제기됩니다.

주요 내용

AI 모델의 안전 테스트 효과는 AI 기업의 투명성과 정부와의 진정한 협력 여부에 달려 있습니다.
정부는 AI 랩에서만 볼 수 있는 프론티어(frontier) AI 모델의 역량을 파악하기 어렵다는 관측 문제입니다.
새로운 AI 모델에 대한 사이버 방어 구축 시기가 짧아질 수 있으며, 정부 프로그램도 단기간 내에 프론티어 모델을 제대로 검증하기 어려울 수 있습니다.
사전 배포 테스트는 한계가 있으며, 공격자들은 프론티어 모델을 자동화된 사이버 공격에 사용하고 있으며, 오픈 웨이트(open-weight) 시스템으로도 유사한 취약점 추론이 가능합니다.
AI 기업들은 정부와의 협력보다 상업적 이익을 위해 신속한 승인을 추구할 수 있으며, 악의적인 해킹이 불가능하면서도 상업적으로 매력적인 모델 개발이 어려울 수 있습니다.
행정명령(EO)은 단기적인 사이버 보안 이점을 제공할 수 있지만, 장기적인 효과는 불확실합니다.
이 행정명령은 분류된 사이버 벤치마킹, 자발적인 사전 출시 평가, 조정된 취약점 스캔 등 국가 안보 커뮤니티가 수십 년간 필요로 할 기능을 생성합니다.
AI 기술 발전 속도에 맞춰 안전 테스트가 진화해야 하며, 그렇지 않으면 '어제의 위험'을 기준으로 새로운 모델을 평가하게 될 위험이 있습니다.
이 과정의 성공은 깊은 기술 전문 지식과 기밀 국가 안보 통찰력을 가진 이해관계자 간의 정직한 교환에 달려 있습니다.

시사점

AI 모델 테스트는 기술적 투명성과 정부의 역량 강화라는 두 가지 핵심 과제를 해결해야 하며, 지속적인 협력과 빠른 기술 변화에 대한 대응력 확보가 중요합니다.

원문 읽기 →

원문을 불러오는 중...

GitHub Discussions

개요

주요 내용

시사점

댓글

관련 기사