Cheaper, faster, and culturally aware, Avataar’s video AI is built for India’s scale

개요

Avataar AI가 인도 시장 규모에 맞춰 개발한 새로운 영상 생성 AI 모델 Varya는 기존 모델 대비 훨씬 저렴하고 빠르게, 그리고 현지 문화적 맥락을 이해하는 데 초점을 맞추고 있다.

주요 내용

* 모델 개발 및 성능: Avataar AI는 Alibaba의 공개 영상 생성 모델 Wan 2.2를 기반으로 '증류(distillation)' 기법을 사용하여 Varya를 개발했으며, 50단계에서 4단계로 처리 과정을 단축시켜 Wan 2.2보다 10배 빠른 속도를 제공한다.
* 속도 및 비용 효율성: Varya는 NVIDIA H200 GPU 사용 시 5초 분량의 720p 영상을 45초 만에 생성할 수 있으며, 이는 Wan 2.2의 1,230초와 비교된다.
* 가격 경쟁력: Varya는 초당 영상 생성 비용으로 ₹0.48($0.005)을 책정할 예정이며, 이는 Veo, Kling, Luma, Runway 등 다른 모델들의 초당 $0.10 이상의 비용보다 약 20배 저렴하다.
* 문화적 이해: Varya는 음식, 의류, 건축, 축제 등 인도 현지 문화적 뉘앙스를 인식하도록 큐레이션된 데이터로 학습되었다.
* 공개 및 접근성: Varya는 인도 정부의 AI 모델 및 데이터셋 저장소인 AI Kosh 포털에 오픈 웨이트 모델로 공개되어 개발자들이 자체 호스팅하거나 수정할 수 있다. 또한, 텍스트 프롬프트나 참조 이미지를 사용하여 현재 웹사이트에서 체험해볼 수 있다.
* 인도 AI 시장 전략: Varya의 출시는 인도 AI 산업의 현지화 및 접근성 확대 전략을 반영하며, 정부의 India AI Mission과 연계하여 GPU 컴퓨팅 접근성을 높이고 AI 투자 유치를 목표로 한다.

시사점

Varya 모델은 저렴하고 빠른 영상 생성 능력, 그리고 현지 문화에 대한 이해를 바탕으로 인도 시장의 대규모 AI 도입 장벽을 낮추고, 개발자 생태계를 활성화하는 데 기여할 것으로 보인다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions