China’s DeepSeek previews new AI model a year after jolting US rivals
개요
DeepSeek의 차세대 AI 모델 V4는 미국 경쟁사의 최첨단 폐쇄형 소스 시스템과 경쟁할 수 있는 성능을 갖추었으며, 특히 코딩 능력에서 이전 모델 대비 큰 개선을 이루었다.
주요 내용
- DeepSeek V4는 Anthropic, Google, OpenAI 등 미국 경쟁사의 폐쇄형 소스 시스템과 경쟁할 수 있는 성능을 갖춘 오픈 소스 AI 모델로 공개되었다.
- V4는 이전 모델 대비 상당한 개선을 이루었으며, 특히 AI 에이전트의 핵심 역량이자 ChatGPT Codex 및 Claude Code와 같은 도구의 성공에 기여한 코딩 능력에서 두드러진다.
- 이번 V4 출시는 중국 칩 산업에도 중요한 이정표가 될 수 있으며, DeepSeek는 특히 자체 Huawei 기술과의 호환성을 강조했다.
- DeepSeek는 1년 전, R1 모델을 통해 미국 주요 시스템 대비 훨씬 적은 비용으로 훈련되었다고 주장하며 미국 AI 산업에 영향을 준 바 있다.
- DeepSeek는 V4의 훈련 비용이나 사용된 하드웨어에 대한 세부 정보를 공개하지 않았다.
- 미국 관리들은 DeepSeek가 금지된 Nvidia 칩을 사용했다고 비난했으며, Anthropic은 DeepSeek가 Claude를 자사 제품 개선에 오용했다고 주장했다.
시사점
DeepSeek V4의 출시는 오픈 소스 AI 모델의 발전 가능성을 보여주며, 특히 코딩 능력을 중심으로 AI 기술 경쟁에서 중국 기업의 약진을 시사한다. 또한, 미국의 칩 제재 속에서 중국 내 기술 생태계 강화 노력의 일환으로 해석될 수 있다.
원문을 불러오는 중...
댓글
GitHub Discussions