I open-sourced a 4-agent adversarial code review team. Any coding agent can call it as an MCP server. Built in heym.

개요

오픈소스 4인 에이전트 적대적 코드 리뷰 팀은 heym 기반으로 MCP 서버를 노출하여, Cursor, Claude Code, Codex 등 어떤 코딩 에이전트든 자신만의 결과물에 대한 구조화된 2차 의견 검토를 프로그램적으로 호출할 수 있는 프레임워크를 제공한다.

주요 내용

  • 기존 에이전트 워크플로우의 한계: 현재 에이전트가 생성한 코드의 PR(Pull Request)은 인간이 검토하며, 이는 에이전트 처리량에 비해 느리다. 또한, 에이전트가 스스로를 검토하는 방식은 종종 형식적이며 자기 자신을 감싸는(rubber-stamp) 결과를 낳기 쉽다.
  • 적대적 코드 리뷰 팀의 구조: heym 캔버스 상에 4개의 노드로 구성되며, 1명의 아키텍트 에이전트와 3명의 전문 에이전트(Reasoner, Implementer, Reviewer)로 이루어진다.
  • 아키텍트 에이전트의 역할: Ejentum harness나 HTTP 도구가 없어 직접적인 우려 사항을 생성할 수 없고, 오로지 위임, 분류, 통합만 수행한다. 모든 최종 검토 의견은 전문 에이전트의 증거에서 비롯되며, 아키텍트는 이를 종합한다.
  • 전문 에이전트의 역할 및 Ejentum harness: 각 전문 에이전트는 서로 다른 Ejentum harness(인지적 스캐폴드)를 사용하여 특정 검토 방식을 수행한다.
  • Reasoner (Reasoning harness): 검토 각도를 분해한다.
  • Implementer (Code harness): diff에 대한 검증 테스트를 작성한다.
  • Reviewer (Anti-deception harness): 프레임 텐션(framing tension)을 거부하고 긍정적인 증거를 요구한다.
  • 다양한 LLM 사용: 각 전문 에이전트에 서로 다른 LLM(Anthropic, Google, Alibaba, Zhipu 등)을 사용하여 상관된 실패 모드를 줄인다.
  • 구조화된 결과: 아키텍트는 VERDICT (approve | request_changes | discuss), CHANGE\_CLASSIFICATION, FRAMING\_NOTES, CONCERNS (심각도 포함), REVIEW\_FOCUS 등 구조화된 검토 결과를 출력한다.
  • heym의 역할: heym은 이러한 다중 에이전트 오케스트레이션을 지원하며, 각 워크플로우를 MCP 서버로 노출하여 다른 에이전트들이 호출 가능한 "원시(primitive)"로 사용할 수 있게 한다. 이는 기존의 수직적 SaaS 봇과는 다른, 에이전트 계층을 위한 오픈 레이어를 제공한다.
  • 오픈소스 배포: 워크플로우 JSON, 시스템 프롬프트, 검증 테스트, 설정 가이드가 GitHub에 MIT 라이선스로 공개되었으며, heym 템플릿 마켓플레이스를 통해 원클릭 임포트가 가능하다.
  • 향후 확장 가능성: 이 패턴은 리팩터링 플래너, 보안 감사 트리아지, 프로덕션 디버그 포렌식 등 다른 복합 인지 분석 작업으로 확장될 수 있다.

시사점

본 오픈소스 프레임워크는 에이전트가 생성한 코드에 대한 자동화되고 구조화된 적대적 검토를 가능하게 하여, 에이전트 처리량에 맞는 효율적인 코드 품질 관리와 잠재적인 오류 감소에 기여할 수 있는 개발 방법론을 제시한다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions