Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start
Google의 새로운 멀티모달 모델 제품군인 Gemini Omni는 이미지, 오디오, 텍스트 입력을 기반으로 일관성 있는 고품질 비디오를 생성하며, 향후 오디오에서 비디오, 비디오에서 오디오 생성까지 확장될 계획이다.
최신 기술 뉴스와 에디터 큐레이션
Google의 새로운 멀티모달 모델 제품군인 Gemini Omni는 이미지, 오디오, 텍스트 입력을 기반으로 일관성 있는 고품질 비디오를 생성하며, 향후 오디오에서 비디오, 비디오에서 오디오 생성까지 확장될 계획이다.
Google은 Gemini 기반 모델과 Google Antigravity의 agentic harness를 활용하여 개발된 24/7 에이전트형 개인 비서인 Gemini Spark를 발표했습니다.
Google AI Studio가 웹 기반 Android 앱 개발 기능을 추가하여, 기존의 수 주에 걸리던 앱 제작 과정을 몇 분으로 단축시켰다.
Google I/O 2026에서 Google은 Gemini 앱의 대대적인 업데이트를 발표하며 ChatGPT 및 Claude와 같은 경쟁 서비스에 맞서 AI 허브로서의 입지를 강화하고 개인화된 AI 경험을 제공하는 데 중점을 두었습니다.
Google DeepMind CEO Demis Hassabis는 AI 코딩 능력의 발달이 소프트웨어 개발자 일자리를 대체하기보다는 생산성을 크게 향상시켜 더 많은 프로젝트를 가능하게 할 것이라고 전망합니다.
Gemini 3.5 Flash는 복잡하고 에이전트화된 워크플로우를 실행하도록 설계된 Google의 최신 모델로, 뛰어난 속도로 프론티어 수준의 지능을 제공합니다.
AI 코딩 도구는 소프트웨어 개발 속도를 극적으로 향상시켰지만, 생성된 코드에 대한 신뢰성 부족이라는 새로운 문제를 야기하고 있으며, 이를 해결하기 위한 검증 가능한 AI 엔지니어링 결과물 생성이 중요해지고 있습니다.
LangGraph와 AWS Bedrock AgentCore를 사용하여 메모리 기능을 갖춘 Agentic Conversational FAQ Assistant가 개발되었습니다. 이 시스템은 데이터셋에 대한 컨텍스트 인식 및 메모리 유지 기능을 제공하며, FAISS 벡터 인덱스를 활용하여 정보를 검색하고 AWS Bedrock AgentCore의 메모리 레이어를 통해 다중 턴 대화의 컨텍스트를 관리합니다.
Novasas Agent는 이전 고객 상호작용을 기억하고 맥락적 기억을 활용하여 개인화된 응답을 제공하는 AI 지원 시스템입니다.
surveilr는 사용자의 이메일 받은 편지함을 SQLite 데이터베이스로 변환하여, 기존 이메일 클라이언트의 검색 기능을 넘어선 복잡한 데이터 분석 및 쿼리가 가능하게 하는 도구입니다.
Gemini는 학생이 강의 계획서(syllabus)를 5분 안에 학습 계획, 퀴즈, 마인드맵 등으로 변환하도록 지원하는 실험을 수행했습니다.
Lean 4와 같은 도구를 통해 프로그래머에게 종속 타입(dependent types)의 실용적인 개념과 중요성을 소개하며, 컴파일러가 더 많은 프로그램 가정을 이해하도록 하여 소프트웨어의 오류를 줄이는 방법을 설명합니다.
Gemini Intelligence는 단순한 AI 기능 업데이트를 넘어선 플랫폼 전환으로, Google의 Android 17 OS 전반에 걸쳐 통합되어 사용자 경험과 개발 방식을 근본적으로 변화시킬 것으로 예상됩니다.
AI 기반 이름 안내 시스템이 졸업식에서 이름 오류와 누락을 발생시켜 참석자들에게 불편을 초래했으며, 이는 기술 도입의 실효성에 대한 의문을 제기합니다.
AI 연구원 Andrej Karpathy가 Anthropic의 pre-training 팀에 합류하여 LLM 연구 개발에 복귀한다.
AI 연구원인 Jared Kaplan이 Anthropic에 합류하여 AI 연구 및 개발 분야에서 새로운 행보를 시작한다.
전직 OpenAI 직원들과 AI 안전 비영리 단체들은 Elon Musk의 xAI의 낮은 안전 기록이 SpaceX의 IPO에 잠재적인 위험이 될 수 있다고 경고하고 있다.
Apple이 발표한 접근성 기능 업데이트는 iPhone, Mac, Vision Pro를 포함한 플랫폼 전반에 걸쳐 AI 기반 처리를 강화하는 새로운 기능을 선보인다.
Status AI는 사용자가 어떤 캐릭터든 되어 좋아하는 세계관 속에서 몰입형 엔터테인먼트를 즐길 수 있는 소셜 미디어 앱을 개발하며, 이를 위해 1,700만 달러의 투자를 유치했다.
NextEra Energy와 Dominion의 670억 달러 규모 합병 제안은 데이터 센터의 급증하는 전력 수요에 대응하는 과정에서 업계를 재편할 잠재력을 가지고 있으며, 이는 소비자 요금 인상과 환경 문제 제기로 이어질 수 있습니다.