How robots learn: A brief, contemporary history

개요

로봇 학습 방식의 근본적인 변화는 과거의 실패를 딛고 최근 몇 년간 휴머노이드 로봇 분야에 막대한 투자가 이루어지도록 만들었으며, 이는 AI 모델이 방대한 데이터를 활용하여 복잡한 작업을 수행하는 능력에 기반합니다.

주요 내용

* 과거 로봇 개발의 한계: 과거 로봇 공학은 모든 가능성을 예측하고 규칙 기반으로 코딩하는 방식에 의존했으나, 이는 복잡성으로 인해 현실 세계의 다양한 변수에 대처하는 데 한계가 있었습니다.
* 시뮬레이션 기반 학습의 등장: 2015년경부터 로봇 팔과 환경의 디지털 시뮬레이션을 구축하고 시행착오를 통해 학습시키는 강화 학습 방식이 도입되었습니다.
* LLM의 영향과 개념 전환: 2022년 ChatGPT의 등장 이후, 대규모 언어 모델(LLM)의 성공은 로봇 분야에서도 센서 데이터와 관절 위치 등을 입력받아 다음 행동을 예측하는 AI 모델에 대한 의존도를 높였습니다.
* Jibo의 사례: 2014년 출시된 소셜 로봇 Jibo는 LLM 이전 시대의 한계를 보여주며, 향상된 언어 능력의 필요성을 시사했습니다.
* OpenAI Dactyl의 시뮬레이션과 Domain Randomization: OpenAI의 로봇 손 Dactyl은 시뮬레이션 학습에 성공했지만, 현실 세계와의 불일치를 극복하기 위해 다양한 환경 변수를 무작위로 적용하는 Domain Randomization 기법을 활용했습니다.
* Google DeepMind RT-1 및 RT-2: Google DeepMind는 실제 인간의 작업을 촬영한 데이터를 활용하여 로봇의 행동을 학습시키는 RT-1을 개발했으며, RT-2에서는 인터넷의 일반적인 이미지 데이터를 활용하여 시각적 이해 및 복잡한 명령 수행 능력을 향상시켰습니다.
* Covariant RFM-1의 협업 기능: Covariant는 창고 환경에서 물건을 집고 옮기는 데 특화된 로봇 팔을 개발했으며, RFM-1 모델은 동료처럼 상호작용하며 작업 맥락을 이해하고 조언을 구하는 능력을 보여주었습니다.
* Agility Robotics Digit의 실용적 적용: Agility Robotics의 휴머노이드 로봇 Digit는 노출된 관절 디자인과 같은 기능 중심 설계로, 실제 창고 환경에서 배송 토트를 이동하고 쌓는 작업에 투입되어 실질적인 비용 절감 효과를 제공하고 있습니다.
* 학습 방식의 융합: 현재 로봇 개발은 시뮬레이션 기법, LLM과의 연동 등 다양한 학습 방식을 융합하여 새로운 환경에 적응하는 능력을 강화하고 있습니다.

시사점

최근 몇 년간 LLM의 발전과 시뮬레이션 기반 학습 기법의 성숙은 로봇이 복잡하고 동적인 환경에서 인간과 협력하거나 인간의 역할을 대체할 수 있는 가능성을 열었으며, 이는 물류, 서비스 등 다양한 산업 분야에서 로봇의 실제 적용을 가속화할 것으로 전망됩니다.

원문 읽기 →
원문을 불러오는 중...

댓글

GitHub Discussions