⭐ 관심사 & 태그

One Ruler to Measure Them All: How Language Affects LLM Quality

LLM 성능에 언어가 미치는 영향은 모델 아키텍처나 프롬프팅 외에 토크나이저가 핵심적인 역할을 하며, 이는 텍스트가 컨텍스트 창에 얼마나 많이 들어가는지를 결정한다.

Will Opus 4.8 change our daily routine, or did it just add a slider?

Anthropic의 Opus 4.8 모델은 기존 API 파라미터였던 'Effort' 조절 기능을 사용자 인터페이스(UI)로 옮기고, 이를 통해 사용자가 직접 모델의 추론 수준을 제어할 수 있게 함으로써 일상적인 사용 패턴에 변화를 가져올 수 있다는 가능성을 제시한다.

Glean’s top line crosses $300M as AI budget cutting becomes its major selling point

Glean은 연간 반복 매출(ARR) 3억 달러를 돌파했으며, 이는 15개월 전 1억 달러 달성 대비 3배 증가한 수치로, 기업용 AI 검색 시장에서 경쟁 심화에도 불구하고 빠른 성장을 기록하고 있다.

The mysterious Hy3 LLM is topping OpenRouter Model Rankings by a large margin

OpenRouter의 LLM 모델 순위에서 Tencent의 Hy3 Preview 모델이 Claude를 크게 앞서며 높은 사용량을 기록하고 있으나, 실제 모델 성능은 이에 미치지 못하는 것으로 나타나 그 배경에 대한 의문이 제기되고 있습니다.

The internet is being rebuilt for machines

Amazon Web Services (AWS)는 AI 에이전트의 동적이고 예측 불가능한 트래픽 패턴에 맞춰 설계된 차세대 OpenSearch Serverless를 출시했습니다. 이는 기존의 인간 중심 클라우드 인프라가 기계 중심의 인터넷으로 전환되는 추세에 대응하는 움직임입니다.

Various LLM Smells

LLM(Large Language Model)을 활용한 콘텐츠 생성 시 나타나는 특정 패턴, 즉 'AI 스멜'이라는 현상이 다양한 AI 기반 작업에서 관찰되며, 이는 AI가 생성한 텍스트와 웹사이트 디자인 등에서 감지될 수 있다.