Physical Intelligence, a hot robotics startup, says its new robot brain can figure out tasks it was never taught
개요
Physical Intelligence는 새로운 로봇 두뇌 모델인 π0.7을 공개했으며, 이는 이전에 훈련받지 않은 작업도 수행할 수 있는 능력을 보여주며 범용 로봇 두뇌 개발에 중요한 진전을 이루었습니다.
주요 내용
- 합성 일반화 능력: π0.7 모델은 서로 다른 맥락에서 학습된 기술을 조합하여 이전에 접해보지 못한 문제를 해결하는 '합성 일반화' 능력을 보여줍니다. 이는 기존의 각 작업별 전문 모델 훈련 방식에서 벗어난 것입니다.
- 이전 훈련 경험 활용: 에어프라이어를 이용한 요리 시연에서, 모델은 관련성이 적은 두 가지 훈련 에피소드와 웹 기반 사전 훈련 데이터를 활용하여 기기의 작동 방식을 기능적으로 이해하고, 인간의 단계별 음성 지침에 따라 성공적으로 작업을 수행했습니다.
- 새로운 환경에서의 즉각적인 개선 가능성: 모델이 새로운 환경에서 제로 코칭으로 작업을 시도하고, 인간의 실시간 음성 지침을 통해 개선될 수 있다는 점은 추가 데이터 수집이나 모델 재훈련 없이 로봇을 새 환경에 배치하고 실시간으로 개선할 수 있음을 시사합니다.
- 인간의 프롬프트 엔지니어링 중요성: 작업 설명 방식(프롬프트 엔지니어링)의 개선이 모델의 성공률에 큰 영향을 미칠 수 있으며, 초기 실험에서 5%였던 성공률이 30분간의 프롬프트 개선 후 95%로 향상되었습니다.
- 제한된 다단계 작업 자율 수행: 현재 모델은 단일 고수준 명령으로 복잡한 다단계 작업을 자율적으로 실행하지는 못하지만, 단계별 지침으로는 비교적 잘 수행합니다.
- 기존 모델 대비 성능: π0.7은 커피 만들기, 세탁물 접기, 상자 조립 등 다양한 복잡한 작업에서 기존의 개별 작업에 특화된 모델과 동등한 성능을 보였습니다.
- 연구진의 놀라움: 연구진은 훈련 데이터를 기반으로 모델의 성능을 예측했지만, π0.7은 예상치 못한 작업을 수행하며 연구진 스스로를 놀라게 했습니다.
시사점
π0.7 모델의 능력은 로봇 AI가 언어 모델의 발전과 유사한 변곡점에 도달하고 있음을 시사하며, 향후 더욱 범용적이고 유연한 로봇 시스템 개발의 가능성을 열어줍니다.
원문을 불러오는 중...
댓글
GitHub Discussions