EvanFlow – A TDD driven feedback loop for Claude Code
개요
EvanFlow는 Claude Code를 위한 TDD(Test-Driven Development) 기반의 반복적인 피드백 루프를 제공하는 소프트웨어 개발 도구입니다. 16개의 스킬과 2개의 커스텀 서브에이전트를 활용하여 아이디어 구상부터 구현까지, 사용자가 제어할 수 있는 체크포인트를 거치며 진행됩니다.
주요 내용
- TDD 기반 피드백 루프: EvanFlow는 단일 생성 방식이 아닌, 반복을 통해 역량이 축적되는 TDD 원칙을 중심으로 구축되었습니다. 각 단계마다 디자인 승인, 계획 승인, 반복 후 등 사용자가 개입할 수 있는 명확한 체크포인트를 제공합니다.
- 통제 가능한 워크플로우: 에이전트는 Git 작업 직전에 멈춰 사용자의 지시를 기다리며, 자동 커밋, 강제적인 절차, 스킬 호출 의무화 등이 없습니다.
- 설치 용이성: Claude Code 플러그인 마켓플레이스를 통해 간편하게 설치할 수 있으며,
/plugin marketplace add evanklem/evanflow및/plugin install evanflow@evanflow명령어로 설치 후let's evanflow this명령어로 시작할 수 있습니다. Git 가드레일 훅도 자동으로 활성화됩니다. - 단계별 검증:
- 브레인스토밍: 의도 명확화, 2-3가지 접근 방식 제시 및 검증.
- 계획: 파일 구조 우선 설계, 단계별 작업 분할, 삭제 테스트.
- 실행: 작업별 순차적 또는 병렬 실행, 인라인 검증.
- TDD: 버티컬 슬라이스 TDD 방식, 하나의 실패하는 테스트 → 최소 구현 → 반복.
- 반복: 변경 사항 재검토, 품질 검사, UI 스크린샷 캡처, 5가지 실패 모드 체크리스트 적용 (환각 행동, 범위 증가, 연쇄 오류, 컨텍스트 손실, 도구 오용). 최대 5회 반복 후 종료.
- 병렬 처리: 3개 이상의 독립적인 단위가 있는 계획의 경우, 각 단위별 코더와 감독관, 그리고 통합 감독관을 활용한 병렬 오케스트레이션 모드를 지원합니다. 통합 테스트는 실행 가능한 계약 역할을 수행합니다.
- 엄격한 규칙: 에이전트는 값(파일 경로, 환경 변수, ID 등)을 임의로 생성하지 않으며, 불확실한 경우 사용자에게 질문합니다. LLM 생성 테스트 어설션의 정확성 문제를 해결하기 위해 에이전트와 감독관이 검증을 수행합니다. 컨텍스트 드리프트를 감지하고 대응하는 메커니즘을 갖추고 있습니다.
- 16가지 스킬 및 2가지 커스텀 서브에이전트: 브레인스토밍, 계획 작성, 실행, TDD, 반복, 컨텍스트 관리, 아키텍처 개선, 인터페이스 설계, 디버깅, PRD 생성, QA 등 다양한 기능을 수행하는 스킬을 제공합니다.
evanflow-coder와evanflow-overseer서브에이전트는 코드 구현 및 검토를 담당합니다. - Git 가드레일 훅:
hooks/block-dangerous-git.sh스크립트를 통해 위험한 Git 작업(push, reset --hard 등)을 차단하여 안전한 개발 환경을 보장합니다. - 유연한 설치 및 사용자 정의: 플러그인, npx CLI, 수동 복사 등 세 가지 설치 경로를 제공하며, 프로젝트의 특정 요구사항에 맞춰 스킬 및 규칙을 사용자 정의할 수 있습니다.
시사점
EvanFlow는 LLM 기반 코드 생성의 한계를 극복하고, 개발자가 주도권을 유지하며 안전하고 효율적으로 소프트웨어를 개발할 수 있도록 지원하는 강력한 프레임워크를 제시합니다. TDD, 명확한 체크포인트, 엄격한 규칙 적용을 통해 AI 코딩의 신뢰성과 생산성을 크게 향상시킬 수 있습니다.
원문을 불러오는 중...
댓글
GitHub Discussions