ThriftAttention keeps 90% quality with 5% compute
ThriftAttention은 쿼리-키 행렬의 5%만 FP16으로 연산하고 나머지는 FP4로 유지하는 혼합 정밀도 기법으로, FP4 연산 대비 약 90%의 품질을 유지하면서 컴퓨팅 비용을 크게 절감합니다.
최신 기술 뉴스와 에디터 큐레이션
ThriftAttention은 쿼리-키 행렬의 5%만 FP16으로 연산하고 나머지는 FP4로 유지하는 혼합 정밀도 기법으로, FP4 연산 대비 약 90%의 품질을 유지하면서 컴퓨팅 비용을 크게 절감합니다.
플로리다주가 OpenAI와 CEO Sam Altman을 상대로 ChatGPT와 관련된 수많은 사건, 특히 아동 피해와 관련된 사건에 대해 소송을 제기했습니다.
인스타그램 계정이 Meta의 AI 지원 챗봇을 속여 접근 권한을 얻게 한 해킹 공격으로 인해 침해되었다.
SpaceX는 IPO 서류에 데이터 센터 냉각에 필수적인 물 접근성을 중요한 위험 요소로 명시하며, AI 인프라 확장에 있어 전력, 프로세서와 마찬가지로 물 자원의 중요성을 강조했습니다.
Superintelligence: The Idea That Eats Smart People은 인공지능(AI)의 초지능화 가능성과 그로 인한 잠재적 위험을 탐구하며, 이러한 주장에 대한 반박 논리를 제시한다.
General Motors (GM)는 AI/ML 기술을 활용하여 자동차 개발 및 설계 프로세스의 효율성을 극적으로 향상시키고 있다.
AI 기업 Anthropic이 대규모 기업공개(IPO)를 위한 첫 단계로 미국 규제 당국에 비공개 서류를 제출했다.
샌프란시스코 기반의 로봇 스타트업 The Bot Company가 에어비앤비(Airbnb) 호스트의 집을 로봇 프로토타입 테스트 장소로 사용하면서 발생한 손상에 대한 소송에 휘말렸다.
스탠포드 CS336 강좌에서 AI 코딩 도우미(ChatGPT, Claude Code, GitHub Copilot, Cursor 등)가 학생들과 협력할 때 준수해야 할 지침은 AI가 과제 완수를 돕는 솔루션 생성기가 아닌, 학습을 돕는 조교 역할을 수행하도록 하는 데 중점을 둡니다.
Anthropic이 미국 증권거래위원회(SEC)에 기업 공개(IPO) 절차 개시를 위한 서류를 공식 제출하며 공개 상장 과정에 돌입했다.
Anthropic은 Claude를 개발한 AI 연구소로, 미국 증권거래위원회(SEC)에 비공개로 기업공개(IPO)를 위한 초안 등록 명세서를 제출했습니다.
DuckDuckGo는 AI 없는 검색 경험을 기본 설정으로 간편하게 설정할 수 있는 새로운 브라우저 확장 프로그램을 출시하며 AI 반대 정서를 강화하고 있으며, 이는 트래픽 급증과 함께 이루어지고 있습니다.
플로리다 주가 OpenAI와 CEO 샘 알트먼을 상대로 AI의 위험성에 대한 민사 소송을 제기하며, 주 정부 차원에서는 최초의 사례가 되었다.
Anthropic PBC가 미국 증권거래위원회(SEC)에 기업 공개(IPO)를 위한 S-1 서류 초안을 비공개로 제출했으며, 이는 향후 시장 상황에 따라 IPO를 진행할 수 있는 선택권을 확보한 것이다.
WindBorne Systems가 개발한 AI 기반 날씨 예측 도구인 WeatherMesh-6가 유럽중앙예보센터(ECMWF)의 기존 및 AI 기반 예측보다 더 빈번하고 정확한 예측을 제공하며, 딥러닝 모델에 센서 데이터를 통합하는 방식의 발전을 활용합니다.
DuckDuckGo는 AI 없는 검색 경험을 기본값으로 설정할 수 있는 새로운 브라우저 확장 프로그램을 출시하여 AI에 대한 반감을 이용하고 있으며, 검색 엔진으로의 트래픽이 급증하고 있습니다.
Microsoft는 개발자 컨퍼런스인 Build에서 새로운 AI 모델, Windows 개선 사항, Copilot 슈퍼 앱 등에 대한 발표를 통해 개발자들의 신뢰를 회복하고 AI 시대의 미래를 제시할 예정이다.
Intel은 연말까지 AI 추론 작업을 가속화하는 새로운 GPU인 "Crescent Island"를 출시할 계획이며, 이는 Nvidia 및 AMD의 경쟁 제품 대비 저렴한 메모리와 냉각 기술을 특징으로 한다.
OpenAI의 AI 모델이 80년간 난제로 남아있던 에르되시 단위 거리 추측을 반증하며 수학 분야에서 AI의 발전 가능성을 보여주었습니다.
Agentic Observability는 탐지 중심의 전통적인 옵저버빌리티의 한계를 극복하기 위해, 운영 신호와 엔지니어링 지식을 연결하여 문제 해결 워크플로우를 개선하는 방식입니다.