Google adds Gemini-powered dictation to Gboard, which could be bad news for dictation startups
개요
Google은 Gboard에 Gemini 기반의 새로운 AI 음성 받아쓰기 기능인 Rambler를 출시하여, 기존 받아쓰기 스타트업들과 직접적인 경쟁 구도를 형성하고 있습니다.
주요 내용
- Rambler는 Gboard에 통합된 AI 기반 음성 받아쓰기 기능으로, "음", "아"와 같은 불필 채우기 단어를 제거하고 문장 중간의 수정(예: "오늘 오후 3시... 아니, 2시")을 이해합니다.
- Gemini 기반 다국어 모델을 활용하여 문장 중간의 언어 전환(예: 영어에서 힌디어로)을 지원하는 코드 스위칭 기능을 갖추고 있습니다.
- Google은 Rambler 기능 사용 시 사용자에게 명확하게 알리고, 음성 녹음은 저장하지 않으며 오디오는 사용자 발언 내용 전사만을 위해 사용된다고 밝혔습니다.
- Rambler는 모든 앱에서 사용 가능하여 "키보드를 재창조하는 것"과 같다고 설명되었습니다.
- 개인 정보 보호 측면에서 Google은 온디바이스 및 클라우드 기반 처리를 혼합하여 사용하며, "안전하고 프라이빗"한 기능을 보장하기 위해 "수년간 상당한 투자"를 했다고 강조했습니다.
- 기존에 Wispr Flow, Willow, Superwhisper, Monologue, Handy, Typeless 등 다수의 받아쓰기 앱이 존재했지만, 대부분 데스크톱 및 iOS에 집중되어 안드로이드 시장은 상대적으로 소외되어 있었습니다.
- Google은 지난달 iOS에 온디바이스 Gemma AI 모델 기반의 오프라인 우선 받아쓰기 앱인 AI Edge Eloquent를 출시했으며, Rambler는 이러한 안드로이드 시장의 격차를 좁히기 위한 Google의 명확한 움직임입니다.
- 초기 여름 출시에는 Samsung Galaxy 및 Google Pixel 폰으로 제한되지만, 향후 다른 안드로이드 기기로 확장될 예정입니다.
- Gboard는 전 세계 대다수 안드로이드 사용자의 기본 키보드이기 때문에, Rambler는 수억 명의 사용자에게 사전 설치된 상태로 제공되는 압도적인 유통 이점을 가집니다.
- 플랫폼 차원에서 OS 레벨로 진입하는 경우, 독립형 앱들은 별도 다운로드를 정당화하기 위해 더 나은 정확도, 더 깊은 기능, 또는 더 강력한 개인 정보 보호 보증과 같은 설득력 있는 이유가 필요합니다.
시사점
Rambler의 출시는 Gboard의 방대한 사용자 기반과 Gemini AI의 강력한 기능을 결합하여, 안드로이드용 받아쓰기 앱 시장의 판도를 바꿀 잠재력을 가지며, 독립형 받아쓰기 스타트업들은 차별화된 가치 제공이라는 더 큰 도전에 직면하게 됩니다.
원문을 불러오는 중...
댓글
GitHub Discussions