ChatGPT’s new Images 2.0 model is surprisingly good at generating text
ChatGPT의 새로운 Images 2.0 모델은 텍스트 생성 능력 면에서 괄목할 만한 개선을 보여, 과거 AI 이미지 생성기의 고질적인 문제였던 텍스트 오류를 거의 완벽하게 해결했습니다.
최신 기술 뉴스와 에디터 큐레이션
ChatGPT의 새로운 Images 2.0 모델은 텍스트 생성 능력 면에서 괄목할 만한 개선을 보여, 과거 AI 이미지 생성기의 고질적인 문제였던 텍스트 오류를 거의 완벽하게 해결했습니다.
OpenAI가 ChatGPT의 이미지 생성 AI 모델을 ChatGPT Images 2.0으로 업데이트하여, 하나의 프롬프트로 여러 개의 이미지를 생성하고 텍스트 출력 및 다국어 지원 기능을 강화했습니다.
OpenAI의 업데이트된 이미지 생성기 ChatGPT Images 2.0은 웹 검색 기능을 통합하여 프롬프트당 여러 이미지를 생성하고, 파일 기반 시각적 설명 생성, 이미지 구조 추론 등 더욱 정교한 기능을 제공합니다.
OpenAI CEO Sam Altman이 경쟁사인 Anthropic의 새로운 사이버 보안 모델 Mythos를 '두려움 기반 마케팅'이라고 비판하며, 이는 AI 기술을 소수 엘리트의 손에 쥐게 하려는 시도일 수 있다고 지적했습니다.
CompanyA는 ChatGPT Image generation의 새로운 버전을 출시하며, 이전 버전에 비해 개선된 이미지 생성 능력과 새로운 기능을 선보였습니다.
Mozilla는 Anthropic의 Mythos Preview를 활용하여 Firefox 150 릴리스에서 271개의 취약점을 발견하고 수정했습니다.
AI 플랫폼 Clarifai는 OkCupid로부터 받은 3백만 장의 사진 데이터를 삭제했으며, 해당 데이터로 학습된 안면 인식 AI 모델도 제거했다고 로이터 통신이 보도했습니다.
Trellis AI는 생명을 구하는 의약품 접근성을 높이기 위해 컴퓨터 사용 에이전트를 구축하고 배포하는 스타트업으로, 엔지니어 채용을 진행하며 의료 관련 서류 작업 자동화를 통해 진료 가속화를 목표로 한다.
Anthropic은 Amazon으로부터 50억 달러의 추가 투자를 유치했으며, 이를 통해 Amazon 칩을 활용하여 Claude AI 모델 훈련 및 운영에 필요한 컴퓨팅 자원을 확보할 예정이다.
Latitude가 출시한 Voyage는 AI 기반의 롤플레잉 게임(RPG) 제작 플랫폼으로, 사용자가 AI의 도움을 받아 자신만의 게임 세계를 디자인하고 플레이할 수 있도록 합니다.
Vercel이 Context AI의 OAuth 공급망 공격을 통해 환경 변수 유출을 겪은 사례는 AI 통합의 보안 취약점과 MLOps 통제의 미흡함을 보여주는 현실적인 위협 시나리오를 제시한다.
CrabTrap은 LLM-as-a-judge 프록시 기술로, 프로덕션 환경에서 에이전트의 보안을 강화하고 신뢰성을 검증하는 데 사용됩니다.
Bond는 AI를 활용하여 사용자의 '둠스롤링' 습관을 개선하고 현실 세계에서의 경험을 장려하는 새로운 소셜 미디어 플랫폼입니다.
Portkey의 Agent Gateway는 기업들이 개발한 AI 에이전트를 프로덕션 환경에서 안정적이고 안전하게 운영할 수 있도록 지원하는 새로운 프로덕션 레이어이다.
BotConduct Training Center는 AI 에이전트를 위한 무료 적대적 평가 플랫폼으로, 사용자가 시스템 프롬프트를 추출하거나 권위를 사칭하는 등의 공격적인 상황에서 에이전트의 취약점을 미리 파악할 수 있도록 지원합니다.
AI Manga Translator는 20개 이상의 언어로 만화(Manhua)를 번역하는 과정에서 발생하는 텍스트 확장, 비라틴 문자 처리, 성능 최적화와 같은 엔지니어링 과제를 해결하는 기술을 개발했습니다.
Hasselbott는 프로젝트 관리자의 업무 책임성을 높이기 위해 설계된 AI 시스템으로, 매일 요약된 알림을 제공하고 중요도에 따라 우선순위를 지정하며, 다양한 톤과 기억 메커니즘을 통해 사용자 참여를 유도한다.
YouTube가 AI 생성 콘텐츠, 특히 딥페이크로부터 유명인사를 보호하기 위해 '유사성 탐지' 기술을 엔터테인먼트 업계로 확대 적용한다.
GoModel은 Go 언어로 작성된 오픈소스 AI 게이트웨이로, OpenAI, Anthropic, Gemini 등 다양한 LLM 제공업체에 대한 OpenAI 호환 API를 제공하며 기존 솔루션 대비 44배 가벼운 것이 특징입니다.