TIL: Building Agentic Workflows in Chrome with Gemini Skills
개요
Gemini in Chrome은 사용자의 브라우저 탭 전체에서 정보를 보고, 추론하며, 행동할 수 있는 'Skills' 기능을 통해 에이전트 기반 워크플로우를 구축하는 방법을 탐구합니다.
주요 내용
* Skills 기능의 진화: Skills는 코딩 에이전트 및 Claude Code, Gemini CLI와 같은 도구에서 사용자의 다양한 작업을 효율적으로 수행하도록 돕는 기능으로, 매번 재프롬프팅해야 하는 기존 LLM 상호작용의 문제를 해결합니다.
* 기존 문제점 해결: Skills는 저장된 프롬프트처럼 즉시 트리거될 수 있어 여러 작업을 동시에 관리할 때 시간 절약에 크게 기여합니다. 과거에는 사용자가 수동으로 Google Keep이나 Google Docs에 프롬프트를 저장하고 브라우저에 고정해야 했습니다.
* Gemini in Chrome에서의 활용: Gemini in Chrome에 Skills가 직접 통합되면서 AI는 열려 있는 모든 탭을 동시에 보고, 추론하고, 행동할 수 있게 되어 브라우저 창 전체의 데이터를 종합하고 즉각적으로 행동하는 것이 가능해졌습니다.
* 안전 및 개인 정보 보호: Gemini는 민감한 작업(예: 예약, 이메일 발송) 전에 Human-in-the-Loop(HITL) 확인을 요구하여 무단 실행을 방지합니다. 또한, Google은 로컬에서 작동하는 Gemini Nano 모델을 제공하여 개인 데이터를 클라우드로 전송하지 않고도 작업을 수행할 수 있도록 하여 개인 정보 보호 우려를 해소합니다.
* 엔지니어링 워크플로우 예시:
* Convert to Notes: 긴 글이나 문서를 핵심 아이디어, 프로세스, 주요 어휘에 대한 실행 가능한 요약으로 전환합니다.
* Live Mock Interviewer: LeetCode 문제에 대해 실제 기술 면접 상황처럼 시간 및 공간 복잡성에 대한 질문과 힌트를 제공하며 연습할 수 있도록 돕습니다.
* Competitor Intelligence: 스타트업 랜딩 페이지를 분석하여 고유 가치 제안, 가격 구조, 타겟 고객을 파악하고 업계 리더와 비교하여 제품의 잠재적 격차를 찾습니다.
* Legal/Privacy Decoder: 개인 정보 보호 정책에서 데이터 소유권, 제3자 공유, 자동 갱신과 같은 중요한 위험 신호를 식별하고 일반 영어로 그 의미를 설명합니다.
* Skills 생성 단계별 가이드: Gemini 사이드바에서 'Skills' 버튼을 통해 'Skills Manager'에 접근하고, 'Browse Skills'에서 미리 만들어진 옵션을 탐색하거나 'Your Skills'에서 직접 'Add' 버튼을 눌러 이름과 지시사항을 입력하여 Skills를 생성할 수 있습니다.
시사점
Gemini Skills는 사용자가 개인화된 AI 에이전트를 구축하여 복잡한 정보를 빠르고 효율적으로 요약, 분석, 연습하는 등 다양한 작업을 수행할 수 있도록 함으로써 생산성 향상과 업무 자동화 가능성을 제시합니다.
댓글
GitHub Discussions