Google Gemma 4 Runs Natively on iPhone with Full Offline AI Inference

개요

Google Gemma 4 모델 제품군이 iPhone에서 완전한 오프라인 추론을 지원하며 기기 내 AI(On-device AI)의 상용화 가능성을 높이고 있다.

주요 내용

* Gemma 4는 Google의 오픈소스 모델로, iPhone에서 API 호출이나 클라우드 의존 없이 로컬에서 직접 실행된다.
* 31B 변형 모델은 Qwen 3.5의 27B 모델과 유사한 성능을 보이며, E2B와 E4B 같은 소형 변형 모델은 모바일 환경에 최적화되어 효율성을 우선시한다.
* Google AI Edge Gallery 앱을 통해 사용자는 선호하는 Gemma 4 모델을 선택하고 즉시 기기 내 추론을 시작할 수 있으며, 이 갤러리는 이미지 인식, 음성 상호 작용 및 확장 가능한 Skills 프레임워크를 포함한 플랫폼 기능을 제공한다.
* Gemma 4 추론은 iPhone의 GPU를 활용하며, 낮은 지연 시간으로 응답이 제공되어 소비자 하드웨어가 고성능 AI 워크로드를 지원할 수 있음을 입증한다.
* 완전한 오프라인 기능은 데이터 프라이버시가 중요하거나 클라우드 처리가 어려운 현장 적용, 의료 환경 등 다양한 기업용 사용 사례에 새로운 가능성을 제시한다.

시사점

Gemma 4의 iPhone 온디바이스 AI 지원은 기술적 시연을 넘어, 소비자와 개발자에게 기기 내 AI의 실질적인 활용이 이미 시작되었음을 알리는 중요한 이정표가 된다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions