Show HN: Browser Harness – Gives LLM freedom to complete any browser task
개요
Browser Harness는 LLM이 브라우저에서 발생하는 모든 작업을 완료할 수 있도록 완전한 자유를 제공하는 단순하고 얇은 자가 복구 하네스입니다.
주요 내용
* CDP 기반 구현: Browser Harness는 Chrome DevTools Protocol(CDP)에 직접 구축되어 프레임워크, 레시피 또는 특정 틀 없이 작동합니다.
* 실시간 수정 기능: 에이전트가 작업 수행 중에 누락된 함수를 발견하면, 하네스 자체를 편집하여 필요한 코드를 추가하고 작업을 계속 진행할 수 있습니다. 예를 들어, 파일 업로드 시 helpers.py에 upload_file() 함수를 직접 작성하여 문제를 해결합니다.
* 간편한 설정 및 사용: install.md를 통해 설치 및 브라우저 연결을 수행하고, SKILL.md를 통해 일상적인 사용법을 익힐 수 있습니다. helpers.py 파일에는 핵심 도구 함수들이 포함되어 있습니다.
* GitHub 연동 및 데모: 초기 설정 시 GitHub 계정에 로그인되어 있다면, 에이전트가 자동으로 GitHub 저장소를 열고 별표(star)를 누를지 묻는 데모 시나리오를 제공합니다.
* 무료 원격 브라우저 제공: 스텔스 작업, 서브 에이전트 활용 또는 배포를 위해 무료 원격 브라우저 기능을 제공하며, 3개의 동시 브라우저, 프록시, 캡차 해결 등의 기능을 포함합니다.
* 기여 모델: 새로운 도메인 스킬(특정 웹사이트 또는 작업에 대한 에이전트의 학습)을 domain-skills/ 아래에 기여하는 것을 권장하며, 에이전트가 작업 중 스스로 학습한 내용을 기반으로 스킬 파일이 자동으로 생성됩니다.
시사점
Browser Harness는 LLM이 브라우저 기반 작업을 동적으로 학습하고 적응하며 수행할 수 있도록 하는 새로운 접근 방식을 제시하며, 이를 통해 자동화 및 에이전트 기술의 발전에 기여할 수 있습니다.
댓글
GitHub Discussions