The Model Is the Brain. The Harness Is the Body. Here's Why That Matters

개요

최근 개발 동향에서 모델은 뇌에 해당하고, 에이전트 하네스(harness)는 몸체에 비유되며, 에이전트의 핵심 경쟁 우위는 모델 자체가 아닌 하네스 레이어에 있다는 점이 강조되고 있습니다.

주요 내용

* 모델 vs. 하네스:
* 과거 500줄의 Python 코드로 작성된 특정 브라우저 자동화 에이전트는 특정 작업에 대해 더 빠르고 저렴하며 안정적이지만, 유연성이 떨어집니다.
* 반면, 7줄의 JSON 설정으로 구현된 에이전트 하네스는 임의의 웹사이트 탐색, 정보 추출, 폼 채우기 등 범용적인 작업에 적합하며, 개발 시간이 획기적으로 단축됩니다.
* 각종 모델(Claude, GPT, Gemini 등)의 성능 차이는 점차 희미해지고 있으며, 생산 환경에서 에이전트를 실제로 작동시키는 "하네스" 즉, 오케스트레이션 루프, 도구 실행, 메모리 관리, 보안, 컴퓨트 격리 등이 중요해지고 있습니다.
* 하네스가 새로운 경쟁 전장:
* AWS AgentCore Harness, Google Gemini Enterprise Agent Platform, Microsoft Azure AI Agent Service, Salesforce Agentforce 등 클라우드 제공업체들이 하네스 시장을 선점하기 위해 경쟁하고 있습니다.
* 이는 과거 컨테이너 오케스트레이션 경쟁과 유사하며, 하네스를 통제하는 주체가 향후 클라우드 시장의 주도권을 쥘 것으로 예상됩니다.
* AWS AgentCore Harness 작동 방식:
* 사용자의 프롬프트는 AgentCore Harness를 통해 Bedrock 모델로 전달되어 추론합니다.
* 모델은 도구(예: 브라우저, 셸, 코드)를 선택하며, 각 세션은 Firecracker microVM을 통해 격리됩니다.
* 선택된 도구는 정보를 처리하고, 이 정보는 영구적인 메모리로 저장될 수 있습니다.
* 최종 결과는 사용자에게 스트리밍됩니다.
* AWS는 컴퓨트, 오케스트레이션, 도구 호출, 메모리, 인증, 관찰 가능성 등을 관리하며, 사용자는 JSON 설정과 프롬프트만 처리하면 됩니다.
* AgentCore Harness 활용 예시 및 고려사항:
* CLI를 통해 AgentCore Harness를 설치하고, 프로젝트를 생성하며, 브라우저 도구를 추가하고, AWS 계정에 배포 및 호출하는 과정을 실제로 수행할 수 있습니다.
* 실제 실행 결과는 웹 페이지 내용을 정확하게 묘사하며, 이는 데모가 아닌 실제 운영 환경에서의 성능을 보여줍니다.
* 비용은 Bedrock 토큰 및 브라우저 세션 시간에 따라 발생하며, 특정 리전에서 미리보기(preview) 상태로 제공됩니다.
* 다양한 Bedrock 모델뿐만 아니라 OpenAI 및 Gemini 모델도 지원하며, 세션 중 모델 전환이 가능합니다.
* Firecracker microVM 격리, IAM 실행 역할, Cedar 정책 등을 통한 보안이 제공됩니다.
* 현재는 미리보기 단계이므로 프로덕션 워크로드에는 적합하지 않을 수 있습니다.
* 하네스 사용을 권장하지 않는 경우:
* 매번 동일한 단계로 실행되는 결정론적 자동화 작업(Playwright 등 사용 권장).
* 복잡한 다중 에이전트 워크플로우(Strands Agents SDK 활용 권장).
* 기존 프레임워크 투자(LangChain/CrewAI)가 있는 경우(AgentCore 도구 독립적으로 사용 가능).

시사점

에이전트 개발에서 모델 선택만큼 하네스 구축이 중요해지고 있으며, AWS AgentCore Harness와 같은 관리형 에이전트 인프라를 활용하는 것이 기술 부채를 줄이고 솔루션 개발에 집중하는 데 유리합니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions