Show HN: Find the best local LLM for your hardware, ranked by benchmarks
whichllm은 사용자의 하드웨어 사양(GPU, CPU, RAM)을 자동으로 감지하여, 해당 시스템에 최적으로 실행될 수 있는 HuggingFace의 LLM 모델을 벤치마크 기준으로 순위 매겨 추천하는 도구입니다.
최신 기술 뉴스와 에디터 큐레이션
whichllm은 사용자의 하드웨어 사양(GPU, CPU, RAM)을 자동으로 감지하여, 해당 시스템에 최적으로 실행될 수 있는 HuggingFace의 LLM 모델을 벤치마크 기준으로 순위 매겨 추천하는 도구입니다.
Mira Murati가 공동 창업한 Thinking Machines Lab은 인간과 AI의 협력을 중심으로 하는 새로운 AI 개발 비전을 제시하며, 단순한 자동화를 넘어 인간의 참여를 유지하는 '인간 중심'의 초지능 구축을 목표로 합니다.
중국 단편 드라마 산업은 생성형 AI를 활용하여 콘텐츠 제작을 자동화하고 비용을 절감하며, 이를 통해 폭발적인 성장과 해외 시장 확장을 이루고 있다.
AI 에이전트는 외부 검증 기준이 없을 때 자신의 결과물 품질을 과대평가하는 경향이 있으며, 특히 주관적인 작업에서는 단순한 "성찰"만으로는 충분한 개선을 이끌어내기 어렵습니다.
Google I/O 2026과 같은 주요 기술 컨퍼런스에서 발표되는 새로운 기능과 변경 사항이 기존 기술 스택에 미치는 영향을 사전에 파악하고 대응하기 위한 5가지 핵심 신호(Signal) 및 관련 엔지니어링 조치 목록이 제시됩니다.
MiMo를 활용한 10개의 전문 AI 에이전트가 코드를 병렬로 검토하여 30초 내에 GitHub PR에 인라인 주석을 포함한 위험 보고서를 생성하는 시스템 아키텍처와 학습된 내용을 공유한다.
UniPool과 MASCing은 Mixture-of-Experts (MoE) 모델의 파라미터 수를 줄이면서 성능을 유지하거나 향상시키고, 안전성을 강화하는 새로운 접근 방식을 제시한다.
Claude Code가 대규모 코드베이스에서 성공적으로 적용되기 위한 패턴들은 코드 탐색 방식, 모델 자체보다 중요한 '하네스(harness)'의 구성, 그리고 조직적 지원과 유지보수 전략을 중심으로 설명됩니다.
프론티어 AI 모델에 대한 접근성은 곧 경제적 및 보안적 제약으로 인해 제한될 것이며, 이는 AI의 미래를 바라보는 일반적인 관점과 상반된다.
Musk 대 Altman 재판은 OpenAI의 비영리 설립 미션에 대한 가장 진실된 수호자가 누구인지 법정에서 다투고 있으며, 결과와 상관없이 직원, 정책 입안자, 그리고 이 미션을 믿었던 대중이 가장 큰 손실을 보게 될 것으로 보인다.
Rust 컴파일러에 LLM(Large Language Model) 사용에 관한 정책을 수립하여, rust-lang/rust 저장소 기여 과정에서의 LLM 활용 방안을 명확히 하고 저품질 PR을 효과적으로 관리하고자 합니다.
OpenAI를 둘러싼 엘론 머스크와 샘 알트먼 간의 소송에서 캘리포니아 배심원단은 자선 신탁 위반, 부당 이득, 자선 신탁 위반 조력 등 세 가지 주요 쟁점을 심리합니다.
온타리오주 감사관실의 조사에 따르면, 온타리오주 보건 의료 종사자를 위해 승인된 AI Scribe 시스템 중 상당수가 환자 기록에서 처방 약물 정보를 혼동하거나, 중요 세부 정보를 누락하거나, 환자나 의료진이 언급하지 않은 내용을 생성하는 등 기본적인 사실 오류를 빈번하게 발생시키는 것으로 나타났습니다.
Elon Musk의 SpaceXAI는 2월 합병 이후 50명 이상의 연구원과 엔지니어가 회사를 떠나는 등 핵심 인력 이탈을 겪고 있습니다.
Claude for Legal은 다양한 법률 업무 영역에 걸쳐 LLM 기반의 에이전트, 스킬, 데이터 커넥터를 제공하여 법률 워크플로우를 지원하는 시스템입니다. 이 시스템은 Claude Cowork 플러그인 또는 Claude Managed Agents API를 통해 설치 및 배포 가능하며, 법률 전문가의 검토를 위한 초안 생성에 중점을 둡니다.
OpenAI Codex가 모바일 환경으로 확장되어 ChatGPT 앱에 통합됨으로써 사용자는 장치에 관계없이 원격으로 개발 워크플로우를 모니터링하고 관리할 수 있게 되었다.
Codex가 ChatGPT 모바일 앱에 통합되어 사용자가 언제 어디서든 코드 작업 흐름에 참여하고 감독할 수 있게 되었습니다.
OpenAI의 Codex가 ChatGPT 모바일 앱에 통합되어 사용자들이 스마트폰으로 코드를 작성하고 앱을 제어하는 AI 도구를 이용할 수 있게 되었다.
Recursive Superintelligence는 6억 5천만 달러의 투자를 유치하며 설립된 AI 스타트업으로, 인간의 개입 없이 스스로의 약점을 파악하고 개선하는 재귀적 자기 개선 AI 모델 개발을 목표로 합니다.
네바다의 유틸리티 회사인 NV Energy가 2027년 5월까지 타호 호수 지역 주민들에게 전력 공급을 중단하겠다고 통보함에 따라, 49,000명의 캘리포니아 주민들이 새로운 에너지 공급원을 찾아야 하는 상황에 놓였습니다. 이는 NV Energy가 새로운 데이터 센터를 포함한 전력 수요 증가에 대응하기 위한 결정의 일부입니다.