Anthropic's open-source framework for AI-powered vulnerability discovery
개요
Anthropic은 Claude LLM을 활용하여 취약점을 자율적으로 발견하고 수정하는 오픈소스 프레임워크인 defending-code-reference-harness를 공개했습니다.
주요 내용
* 오픈소스 프레임워크: defending-code-reference-harness는 Claude LLM을 기반으로 자율적인 취약점 발견 및 수정 파이프라인을 구현한 레퍼런스입니다. 이는 기존 파트너십에서 얻은 교훈을 바탕으로 개발되었으며, 자체 취약점 탐지 파이프라인 구축, 로직 사용자 정의, 다양한 Claude API 액세스(Bedrock, Vertex, Azure 포함)에 활용될 수 있습니다.
* Claude Code Skills: 프레임워크는 /quickstart, /threat-model, /vuln-scan, /triage, /patch, /customize와 같은 대화형 스킬을 제공하여 빠른 시작과 사용자 정의를 돕습니다.
* 자율 레퍼런스 파이프라인 (harness/): recon → find → verify → report → patch의 자율 탐지 파이프라인을 Docker와 ASAN을 사용하여 C/C++ 메모리 취약점 발견에 맞춰 구성한 예시입니다. 이 파이프라인은 재사용 가능한 프롬프트, 샌드박싱 구조를 가지지만 모든 코드베이스에 즉시 적용되지는 않으며, /customize 스킬을 통해 언어, 탐지기, 취약점 클래스에 맞게 포팅할 수 있습니다.
* 보안: 프레임워크의 스킬들은 파일 읽기/쓰기만 수행하며, /patch 스킬 역시 정적 결과에 대해서는 읽기/쓰기만 합니다. /customize는 하니스 코드 편집 및 검증 명령 실행을 포함합니다. 이러한 스킬들은 Claude Code 내에서 도구 사용을 승인하면 샌드박스 외부에서도 안전하게 실행될 수 있습니다. 그러나 자율 레퍼런스 파이프라인(특히 /patch 포함)은 대상 코드를 실행하므로, 명시적으로 재정의하지 않는 한 gVisor 샌드박스 외부에서의 실행을 거부합니다.
* 시작 방법: Git 클론 후 cd 명령으로 디렉토리 이동, claude 실행 후 /quickstart 명령으로 초기 설정을 안내받을 수 있습니다.
* 단계별 접근 방식:
1. Day 1: 위협 모델 구축, 첫 번째 정적 스캔 및 분류(triage) 실행.
2. Day 2: C/C++ 라이브러리에 대해 레퍼런스 파이프라인 실행.
3. Days 3-5: 대상 시스템에 맞게 파이프라인 사용자 정의.
4. Week 2: 사용자 정의된 파이프라인을 이용한 자율 스캔, 분류, 패치 작업 시작.
* 파이프라인 단계: 빌드 (ASAN 포함), 정찰(Recon), 탐색(Find), 검증(Verify), 중복 제거(Dedupe), 보고(Report), 패치(Patch)의 7단계로 구성됩니다.
* 사용자 정의: /customize 스킬은 제공된 산출물(위협 모델, 취약점 발견 목록, 분류 결과)을 사용하여 대상 코드베이스에 맞게 하니스를 수정합니다.
* 자율 스캔, 분류, 패치: 사용자 정의된 파이프라인을 여러 번 실행하고, 결과들을 취합하여 분류하며, 우선순위에 따라 패치를 생성하고 검증합니다.
* 관리형 옵션 (Claude Security): Anthropic은 호스팅된 제품인 Claude Security를 통해 여러 프로젝트에 걸쳐 소스 코드의 취약점을 찾고 수정하는 관리형 서비스를 제공합니다.
시사점
이 오픈소스 프레임워크는 LLM을 활용하여 소프트웨어 취약점 탐지 및 수정 프로세스를 자동화하고 가속화하는 새로운 가능성을 제시하며, 보안 팀이 자체적인 보안 파이프라인을 구축하고 최적화하는 데 실질적인 기반을 제공합니다.
댓글
GitHub Discussions