AI OSS tool repo goes archived over night after raising $7.3M Seed
개요
TensorZero는 통합 API를 통한 LLM 제공업체 접근, 추론 및 피드백 저장, 다양한 평가 방법론, 프롬프트/모델 최적화, A/B 테스트 기능을 제공하는 오픈소스 LLMOps 플랫폼입니다.
주요 내용
* LLM Gateway: 단일 통합 API를 통해 Anthropic, AWS Bedrock, Azure, GCP Vertex AI, Groq, Mistral, OpenAI 등 주요 LLM 제공업체에 접근하며, Tool Use, JSON, 배치, 임베딩, 멀티모달, 캐싱 등을 지원합니다. 🦀 Rust로 구현되어 10k+ QPS에서 1ms 미만의 P99 지연 시간을 달성하며, 라우팅, 재시도, 폴백, 로드 밸런싱 등으로 고가용성을 보장합니다.
* LLM Observability: 오픈소스 UI를 통해 개별 API 호출 디버깅 또는 모델/프롬프트 전반의 메트릭 모니터링이 가능하며, 추론 및 피드백을 자체 데이터베이스에 저장하고 OpenTelemetry 트레이스 및 Prometheus 메트릭으로 내보낼 수 있습니다.
* LLM Optimization: 프로덕션 메트릭 및 사용자 피드백을 활용하여 프롬프트, 모델, 추론 전략을 최적화하며, 지도 학습 미세 조정, RLHF, 프롬프트 엔지니어링 알고리즘, 동적 인컨텍스트 학습 등을 지원합니다.
* LLM Evaluation: 휴리스틱 및 LLM 평가자를 활용하여 개별 추론 또는 엔드투엔드 워크플로우를 평가할 수 있으며, LLM 평가자 자체를 최적화할 수 있습니다.
* LLM Experimentation: A/B 테스트, 라우팅, 폴백, 재시도 기능을 통해 프로덕션 환경에서 자신감을 가지고 배포할 수 있으며, 복잡한 워크플로우를 위한 원칙적인 실험을 지원합니다.
* TensorZero Autopilot: TensorZero의 LLM 관찰 데이터를 분석하고, 평가를 설정하며, 프롬프트와 모델을 최적화하고 A/B 테스트를 실행하는 자동화된 AI 엔지니어입니다.
* 기존 도구와의 통합: OpenAI SDK, OpenTelemetry 및 주요 LLM 제공업체와 원활하게 연동되며, OpenAI 호환 API도 지원합니다.
* 사용 사례: Frontier AI 스타트업부터 Fortune 10 기업까지 사용되며, 전 세계 LLM API 지출의 약 1%를 차지합니다.
시사점
TensorZero는 LLMOps 스택을 통합하고 프로덕션 메트릭 및 사용자 피드백 기반의 최적화를 지원함으로써, 산업 등급의 LLM 애플리케이션 개발 및 배포를 위한 강력하고 유연한 오픈소스 플랫폼을 제공합니다.
댓글
GitHub Discussions