Google makes Interactions API the default way to build with Gemini agents

개요

Google은 Gemini 모델 및 에이전트 개발을 위한 Interactions API를 정식 출시(General Availability)하고, 이를 Gemini 개발의 기본 API로 지정하며 기존 generateContent API의 지원은 유지하되 신규 에이전트 기능의 우선 적용은 Interactions API에 집중될 것임을 발표했습니다.

주요 내용

  • Interactions API 정식 출시 및 기본 API 전환: December 2025년 공개 베타를 시작했던 Interactions API가 정식 출시되어 안정적인 스키마를 제공하며, Google AI Studio, Gemini API 문서, 코드 스니펫 전반에 걸쳐 기본 API로 자리 잡았습니다.
  • 단일 엔드포인트: 개발자는 모델 ID를 통해 일반적인 추론을 수행하거나 에이전트 ID를 통해 장기 실행 자율 작업을 요청할 수 있는 단일 API 엔드포인트를 사용합니다.
  • Managed Agents: 단일 API 호출로 에이전트가 코드를 실행하고, 웹을 탐색하며, 파일을 관리할 수 있는 원격 Linux 샌드박스를 프로비저닝할 수 있으며, 기본적으로 Antigravity 에이전트가 사용되고 사용자 정의 에이전트 정의도 가능합니다.
  • 백그라운드 실행: background=True 설정을 통해 서버에서 장기 작업을 비동기적으로 실행할 수 있습니다.
  • Tool Mixing: Google Search, Google Maps 등 내장된 도구와 사용자 정의 함수를 단일 요청에서 결합할 수 있으며, 도구 결과는 텍스트뿐만 아니라 이미지도 반환할 수 있습니다.
  • Deep Research 업그레이드: 속도/깊이 에이전트 변형, 협업 계획, 네이티브 차트 및 인포그래픽, 이미지, PDF, 오디오를 활용한 멀티모달 정보 습득 기능이 추가되었습니다.
  • 미디어 생성 기능: Nano Banana 2 및 Google Image Search를 활용한 이미지 생성, Lyria 3를 활용한 음악 생성, 다중 화자 텍스트 음성 변환 기능이 언급되었습니다.
  • 비용 제어: Flex와 Priority 티어를 통해 개발팀은 낮은 비용 또는 낮은 지연 시간을 선택할 수 있으며, Flex 티어는 50%의 비용 절감을 제공합니다.
  • 상태 저장: 유료 티어 사용자는 55일간 과거 상호 작용 기록을 검색할 수 있습니다.
  • 새로운 메시지 형식: 기존 역할 기반 메시지 형식에서 벗어나 사용자 입력, 생각, 함수 호출, 모델 출력 등 각 동작을 타입화된 단계로 구분하는 방식으로 스키마가 변경되었습니다.
  • 개발자 고려 사항: Gemini를 기반으로 개발하는 경우, 장기 실행 작업, 에이전트 상태, 도구 호출, 웹/지도 기반 정보 습득, 멀티모달 출력, 원격 실행 등이 필요한 경우 Interactions API로의 전환이 권장됩니다. 신규 기능은 Interactions API에 우선적으로 적용될 가능성이 높습니다.
  • 실질적인 다음 단계: 신규 Gemini 에이전트 프로젝트는 Interactions API로 시작해야 하며, 기존 generateContent 애플리케이션은 유지하되 백그라운드 실행, Managed Agents, 도구 결합 등의 워크플로우 개선 기회를 감사해야 합니다. LiteLLM, Eigent, Agno 등 초기 지원 파트너에 대한 Wrapper 라이브러리 및 내부 SDK 지원 여부를 확인해야 합니다.
  • 제한 사항: Gemini Omni 지원은 아직 완전하지 않으며, "Managed Agents"는 Google 측에서 런타임의 상당 부분을 관리하므로 민감한 코드나 규제 데이터 처리 시 샌드박스 동작, 보존, 로깅, 데이터 제어 등에 대한 검토가 필요합니다. 기존 API는 폐기되지 않았으며, Google은 플랫폼의 미래 방향성을 제시하고 있습니다.

시사점

Google의 Interactions API 기본화는 Gemini 개발 아키텍처의 전환을 의미하며, 장기 실행 작업 및 고급 에이전트 기능 개발 시 Interactions API를 우선적으로 고려해야 함을 시사합니다. 이는 개발자들이 향후 Gemini 플랫폼의 최신 기능들을 활용하고 경쟁력을 확보하기 위한 중요한 전략적 결정 요소가 될 것입니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions