⭐ 관심사 & 태그

Gemini API File Search is now multimodal

Gemini API의 File Search 기능이 멀티모달 데이터(텍스트 및 이미지)와 사용자 정의 메타데이터를 지원하며, 검색 결과에 대한 페이지 단위 인용 기능을 추가하여 검색 증강 생성(RAG) 시스템 개발을 확장했습니다.

Graphs for RAG: Knowledge Graph and GraphRAG (GraphDB)

기술 콘텐츠는 검색 엔진의 정보 검색 성능 향상을 위해 과거의 PageRank 알고리즘에서 발전하여 개념 중심의 이해를 가능하게 하는 Knowledge Graph(KG)와 이를 활용한 GraphRAG(Retrieval-Augmented Generation) 시스템 구축 및 검색 방법에 대해 설명합니다.

A 19th Century Author Taught Me RAG.

Retrieval Augmented Generation (RAG) 기법은 LLM의 정확도를 향상시키기 위해 별도의 데이터베이스에서 관련 정보를 검색하여 프롬프트에 추가하는 방식으로 작동합니다. 본 콘텐츠는 Nathaniel Hawthorne의 단편 소설 "Rappaccini's Daughter"를 사용하여 로컬 환경에서 RAG의 구현 및 효과를 실험한 사례 연구를 제공합니다.

AIOps vs Traditional Monitoring: What Actually Changed

AIOps는 전통적인 모니터링 방식과 달리 시스템 이상 징후를 상관관계 분석을 통해 단일 이벤트로 통합하고, 알림 노이즈를 80%까지 줄이며, 잠재적인 근본 원인을 제시하여 SRE 업무를 지원하는 기술입니다.

The right of an AI agent to stay silent

AI 에이전트의 신뢰성을 확보하기 위해 정확도 중심의 평가에서 벗어나, 잘못된 행동을 0%로 만들고 "모르겠다"고 명확히 밝히는(abstain) 능력을 중요시하는 아키텍처적 변화의 필요성이 제기됩니다.

The new Wild West of AI kids’ toys

AI 키즈 토이는 3세 이상 어린이에게 친근한 동반자로 마케팅되고 있지만, 현재로서는 규제가 거의 이루어지지 않은 범주이며, 부적절한 콘텐츠 노출, 사회 발달에 미치는 영향 등 다양한 우려를 낳고 있습니다.

I Built an Open Source AI Workspace for Paperless-ngx Because I Wanted Document Intelligence

Taan Mind는 Paperless-ngx를 기반으로 개발된 오픈소스 AI 워크스페이스로, 문서 아카이브가 파일 내용을 이해하고 메타데이터를 추출하며 OCR 콘텐츠를 풍부하게 만드는 것을 목표로 합니다.

Compass v0.9 · LongMemEval-S 56.6% · cross-agent memory federation

Compass v0.9은 50K 토큰 길이의 대화 기록에서 LLM의 검색, 계산, 업데이트, 시간적 추론 능력을 평가하는 LongMemEval-S 벤치마크에서 56.6%의 정확도를 달성했으며, 이는 기존 SOTA(State-Of-The-Art)와 유사한 성능을 훨씬 낮은 비용으로 구현합니다. 핵심 기능은 여러 클라이언트(Claude Desktop, Cursor 등)에서 동일한 사용자 ID를 통해 메모리를 공유하는 크로스 에이전트 메모리 연합입니다.

Why most AI agents fail in production

대부분의 AI 에이전트는 시연 환경에서는 작동하지만 실제 운영 환경에서는 실패하며, 이는 신뢰성 및 거버넌스 부족과 표준화되지 않은 접근 방식 때문입니다.

I Trained an LLM on 75K of My Own Messages So It Would Stop Writing Like a Chatbot

한 개인이 자신만의 글쓰기 스타일을 모방하도록 LLM을 훈련시키기 위해 75,000개 이상의 개인 메시지를 활용했으며, 이 과정에서 생성된 콘텐츠가 챗봇처럼 들리는 문제를 해결하기 위해 두 단계로 구성된 아키텍처를 개발했다.

Inside GPT-5.5-Cyber: Capabilities, Refusals, and Federal Briefings Explained

GPT-5.5-Cyber은 OpenAI가 사이버 보안 분야의 특정 워크플로우에 맞춰 파인튜닝하고 강화한 GPT-5.5의 변종 모델로, 현재 TAC(Trusted Access for Cyber) 프로그램 참여자들에게만 제한적으로 제공됩니다.

A recent experience with ChatGPT 5.5 Pro

ChatGPT 5.5 Pro는 수학적 연구 수준의 문제를 신속하게 해결하는 능력을 보여주며, 특히 산술 정수론 분야의 문제에서 기존 연구를 개선하고 새로운 접근 방식을 제시하는 가능성을 보여줍니다.