Meta's AI agent rewrote its own harness 100 times -- the loop that makes self-improving agents work

개요

Meta의 HyperAgents는 AI 에이전트가 자체적인 지침, 제약 조건 및 도구 구성을 포함하는 '하네스(harness)'를 스스로 개선하는 프레임워크를 제시하며, 이를 통해 에이전트의 지속적인 성능 향상을 가능하게 한다.

주요 내용

* 하네스(Harness)의 동적 개선: 기존 AI 에이전트 설정이 고정된 하네스를 사용하는 것과 달리, HyperAgents는 에이전트가 자신의 소스 코드를 읽고, 개선점을 식별하며, 패치를 생성하고, 스스로 업데이트하는 메커니즘을 갖춘다.
* 작업 에이전트와 메타 에이전트의 통합: HyperAgents는 문제 해결을 담당하는 작업 에이전트와 작업 에이전트의 코드 및 행동을 수정하는 메타 에이전트를 단일 편집 가능한 프로그램 내에서 통합하여, 에이전트가 작업 해결 논리뿐만 아니라 개선 메커니즘 자체도 수정할 수 있게 한다.
* 다중 도메인에서의 성능 향상 및 전략 전이: 코딩, 논문 검토, 로봇 공학 보상 설계, 올림피아드 수준 수학 채점 등 네 가지 도메인에서 에이전트들은 지속적으로 자체 성능을 향상시켰으며, 특히 한 도메인에서 학습한 개선 전략이 전혀 다른 새로운 도메인으로 성공적으로 전이되는 발견이 있었다.
* 창발적 능력의 출현: 에이전트들은 명시적인 지시 없이도 스스로 지속적인 메모리 시스템과 자동화된 성능 추적 기능을 발명하고 구축했다.
* 실무 적용 가능한 4단계 개선 주기: 실험실 수준의 완전한 HyperAgents 구현 외에도, '실패 관찰 - 개선 제안 - 승인된 변경 사항 병합 - 측정 및 반복'의 4단계 주기를 통해 현재 구현 가능한 자기 수정 메커니즘을 제시한다.
* 자기 개선의 명확한 경계: 전략적 방향 설정, 품질 기준 정의, 윤리적 경계 설정은 인간의 영역으로 유지되어야 하며, 자기 개선은 확립된 방향 내에서의 정확도 향상에 초점을 맞춘다.
* Hermes Agent의 유사 접근 방식: Hermes Agent v0.10은 실행 추적을 관찰하고 반복되는 패턴을 식별하여 재사용 가능한 스킬로 패키징하는 메커니즘을 통해 20개 이상의 전문화된 스킬을 자율적으로 생성하고 작업 완료 시간을 40% 단축시키는 성과를 보였다.

시사점

AI 에이전트의 하네스(harness)를 시스템적으로 개선하는 접근 방식은 시간이 지남에 따라 성능 격차를 증폭시키며, 생산 환경에서 실행되는 에이전트의 체계적인 오류 수정 및 최적화를 가능하게 할 잠재력이 크다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions