Building an Information Firewall for AI Agents
개요
TrustBoost는 AI 에이전트가 LLM과 상호 작용할 때 민감한 개인 식별 정보(PII) 유출을 방지하고 결제를 검증하는 오픈소스 미들웨어입니다.
주요 내용
* TrustBoost의 기능: AI 에이전트와 LLM 사이에 위치하여 정보 방화벽 역할을 수행하며, PII 레드액션, 결제 검증, 감사 로깅의 세 가지 레이어로 구성됩니다.
* PII 레드액션: GPT-4o-mini를 사용하여 이메일, 비밀번호, 개인 키와 같은 민감 정보를 감지하고 자동으로 제거합니다.
* 결제 검증: Solana 네트워크 트랜잭션을 확인하여 서비스 사용에 대한 결제(149 USDC로 10,000회 검증)를 인간의 승인 없이 처리합니다.
* 감사 로깅: 모든 운영 기록을 Google Sheets에 저장하여 추적 가능성을 확보합니다.
* Solana 기반 선택 이유: 에이전트 간의 트랜잭션 속도, 저렴한 비용, Helius API를 통한 간편한 검증을 위해 Solana를 채택했습니다.
* 테스트 방법: curl 명령어를 사용하여 50회의 무료 요청으로 PII 레드액션 기능을 테스트할 수 있으며, 응답으로 cleaned_text, safety_score, risk_category를 제공합니다.
* AI 에이전트 통합: molt.json 스키마를 노출하여 에이전트가 서비스를 자율적으로 검색하고 사용할 수 있도록 합니다.
* 오픈소스 및 로드맵: MIT 라이선스로 공개되었으며, 향후 FastAPI와 Ollama를 이용한 자체 호스팅 가능한 프록시 버전 출시를 계획하고 있습니다.
시사점
TrustBoost는 AI 에이전트의 보안 및 개인 정보 보호 문제를 해결하는 오픈소스 솔루션을 제공하며, 향후 자체 호스팅 옵션을 통해 더욱 광범위한 프로덕션 환경에서의 적용 가능성을 높입니다.
댓글
GitHub Discussions