Anthropic and the Runtime Harness for Persistent Agents
개요
Anthropic의 연구는 AI 에이전트가 장기 실행 작업에서 인지적 일관성을 유지하는 것이 주요 과제임을 보여주며, 이를 위해 외부 메모리, 체크포인트, 지속적인 재고정(re-anchoring)을 기반으로 하는 런타임 하네스(runtime harness)가 필요함을 제시합니다.
주요 내용
- AI 에이전트 시스템은 단기 작업에서는 잘 작동하는 것처럼 보이지만, 장시간에 걸쳐 여러 단계와 검증을 거치는 작업에서는 목표의 중심을 잃고 인지적 드리프트(cognitive drift) 현상을 겪습니다.
- 기존의 컨텍스트 창(context window)은 장기 실행 작업에 필요한 메모리를 제공하기에 취약하며, 불완전한 압축, 불안정한 중요도, 목표 손실 등의 문제를 겪습니다.
- Anthropic은 에이전트 주변에 영구적인 스크래치패드, 작업 파일, 실행 요약, 직렬화된 체크포인트, 지속적으로 업데이트되는 상태 노트 등으로 구성된 외부 절차적 메모리(external procedural memory)를 구축합니다.
- 이를 통해 에이전트는 모든 것을 "기억"할 필요 없이 이미 설정된 내용을 다시 읽을 수 있으며, 이는 "인위적인 지속성(artificial continuity)"을 생성하는 재고정 주기를 만듭니다.
- Anthropic은 생성 에이전트와 평가 에이전트를 결합하는 생성기/평가기(generator/evaluator) 구조를 활용하여, 검증이 최종 단계가 아닌 인지적 지속성 자체의 일부가 되도록 합니다.
- Anthropic의 런타임 하네스는 에이전트가 더 잘 "행동"하게 만드는 것이 아니라, 더 오래 "생각"하게 만들고 인지적 연속성을 유지하도록 하는 데 중점을 둡니다.
시사점
Anthropic의 런타임 하네스는 AI 에이전트가 장기 작업에서 길을 잃지 않고 일관성을 유지하도록 지원함으로써, 일회성 자동화(episodic automation)와 진정한 자율성(real autonomy) 사이의 중요한 차이를 만들 수 있습니다.
원문을 불러오는 중...
댓글
GitHub Discussions