MCP Just Landed on Your Phone: What Google AI Edge Gallery Actually Does
개요
Google AI Edge Gallery가 Android에서 MCP(Meta-protocol Communication) 연결을 지원하며, LLM(Large Language Model)이 인터넷 연결 없이 기기 자체에서 추론을 수행하고 에이전트 기능을 확장할 수 있게 되었다.
주요 내용
* Google AI Edge Gallery의 에이전트 기능 강화: Google AI Edge Gallery는 Google Research에서 개발한 오픈 소스 Android 앱으로, 이전에는 인터넷 연결 없이 LLM을 기기 자체에서 실행하는 데 초점을 맞췄으나, 최근 I/O 2026에서 에이전트 런타임을 지원하도록 업데이트되었다.
* MCP 연결 및 에이전트 기능: 새롭게 추가된 에이전트 기능은 웹 검색 버튼이 있는 단순한 채팅 인터페이스가 아닌, 스킬 토글, 캘린더 통합, 예약 알림, 실험적인 MCP 연결 등 본격적인 에이전트 런타임을 제공한다. 이는 기존의 에이전트 생태계에서 사용되는 동일한 프로토콜을 활용한다.
* 다양한 LLM 지원 및 LiteRT-LM: Google AI Edge Gallery는 Gemma 모델뿐만 아니라 Alibaba의 Qwen2.5-1.5B-Instruct, DeepSeek-R1-Distill-Qwen-1.5B 등 다양한 LLM을 지원하며, 이 모든 모델은 Google의 모바일 추론 런타임인 LiteRT-LM(이전 TensorFlow Lite)을 통해 실행된다.
* Gemma 4의 32K 컨텍스트 창: Gemma 4 E2B 모델은 2.6GB의 용량으로 32K 컨텍스트 창을 제공하여, 텍스트, 이미지, 오디오를 포함하는 멀티모달 입력을 처리하고 대화 기록, 툴 호출 결과 등 더 많은 정보를 모델에 전달할 수 있다. 이는 이전 2K 미만의 컨텍스트 창으로는 어려웠던 에이전트 활용 사례를 현실화한다.
* 세분화된 스킬 권한 관리: 에이전트 스킬은 12개의 내장 스킬과 사용자 생성 커뮤니티 스킬로 구성되며, 각 스킬은 개별적으로 토글 가능하다. 특히 캘린더 읽기/쓰기 스킬이 분리되어 있어 세분화된 권한 관리가 가능하다.
* MCP 서버 연결 및 인증: MCP 서버 URL을 입력하여 연결할 수 있으며, 현재는 인증 없이(None) 또는 Request Header, OAuth(작업 중) 방식을 지원한다. OAuth가 완성되기 전까지는 공개 MCP 서버만 인증 없이 사용할 수 있다.
* 개발자 중심 설계: AI Chat, Ask Image, Audio Scribe, Prompt Lab 등 각 기능 화면에서 API 문서 및 예제 코드를 직접 확인할 수 있어 개발자가 앱을 읽고, 포크하며, 빌드할 수 있도록 설계되었다.
* 전문 특화된 소형 모델의 가능성: 289MB 크기의 MobileActions-270M 모델은 기기 제어와 같은 특정 작업을 일반 모델보다 더 잘 수행할 수 있으며, TinyGarden-270M과 같은 소형 모델들은 특정 작업에 특화되어 어디에나 적용 가능하다는 것을 보여준다.
* MCP 프로토콜의 보편성: MCP가 Claude, Cursor, VS Code 확장 프로그램 등 다양한 클라이언트와 Google의 온디바이스 런타임에서 동일하게 사용된다는 점은 개발자가 한 번 툴을 MCP 서버로 구축하면 모든 호환 클라이언트에서 사용할 수 있음을 의미한다.
시사점
Google AI Edge Gallery는 온디바이스 에이전트 기술의 현재와 미래를 보여주는 개발자 지향적인 레퍼런스 구현으로, MCP 프로토콜의 확산을 가속화하고 모바일 환경에서의 LLM 활용 가능성을 크게 확장시킬 것이다.
댓글
GitHub Discussions