Apple working to cram massive Gemini model into iPhone to power new Siri

개요

Apple이 Google의 Gemini 모델을 iPhone에 통합하여 Siri를 강화하기 위해 노력하고 있으며, 이는 클라우드 기반 연산에 크게 의존할 것으로 보입니다.

주요 내용

* Apple은 AI 강화 Siri를 여러 차례 연기한 후, 올해 말 Google과의 협력을 통해 Siri를 Gemini와 통합할 예정입니다.
* iPhone의 제한된 처리 환경으로 인해 Apple은 AI 기능을 최적화하는 데 어려움을 겪고 있습니다.
* Apple은 AI를 로컬에서 실행하는 것에 대한 개인 정보 보호 가치를 강조해왔지만, Gemini 통합 Siri는 클라우드와 온디바이스 연산을 모두 사용할 것으로 알려졌습니다.
* 스마트폰 칩의 AI 최적화에도 불구하고, 대부분의 폰 GPU는 AI 중심 NPU보다 더 많은 AI 토큰을 처리할 수 있으며, Neural Engine과 같은 구성 요소는 효율적인 AI 처리에 중점을 둡니다.
* 스마트폰은 대규모 AI 모델을 메모리에 유지하기 위한 RAM이 부족하며, 온디바이스 AI 모델은 일반적으로 수십억 개의 파라미터를 가지는 반면, Google의 Gemini 모델은 수조 개의 파라미터를 가집니다.
* 온디바이스 AI 모델은 정확도 저하를 감수하며 낮은 정밀도로 실행되도록 양자화(quantized)되는 경우가 많습니다.
* Google은 모바일 장치에 최적화된 Gemini Nano 버전을 제공하지만, 이는 Magic Cue 및 오디오 요약과 같은 문맥 기능을 지원하는 데 사용되며, 대화형 보조 서비스인 Siri와는 다른 요구 사항을 가집니다.
* Android에서는 Google의 Gemini와의 대화는 항상 클라우드로 직접 연결됩니다.

시사점

Apple의 Gemini 통합 Siri가 클라우드 연산에 의존하게 되면서, 기존의 로컬 AI 및 개인 정보 보호 중심 전략과의 균형에 대한 논의가 예상됩니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions