구글 AI 연구 부문인 구글 딥마인드가 로봇 팔에 복잡한 작업을 학습시키는 방법을 발표했다. 발표된 방법은 인간 조작으로부터 학습하는 ALOHA Unleashed와 물리 시뮬레이터에서의 학습을 기반으로 한 DemoStart 2가지로 각각 다른 방법으로 로봇 팔에 작업을 학습시킬 수 있다.
먼저 ALOHA Unleashed는 구글 딥마인드와 스탠포드 대학이 공동 개발한 팔 2개를 가진 고성능 로봇 팔 ALOHA 2를 대상으로 개발된 학습 방법. ALOHA Unleashed는 트랜스포머(Transformer)를 기반으로 하며 이미지 생성 AI 등에 사용되는 확산 모델을 활용해 인간 조작을 바탕으로 작업 해결 방법을 학습하는 학습 흐름을 실현하고 있다. 이를 통해 인간 원격 조작으로부터 신발끈 묶기, 다른 로봇 수리하기, 셔츠를 옷걸이에 걸기 등 복잡한 조작을 학습할 수 있다.
다음은 DemoStart. 로봇 팔에는 많은 가동 부품과 센서가 탑재되어 있어 고성능 로봇 팔일수록 조작이 복잡해진다. 따라서 로봇 팔에 자동 조작을 학습시키려면 긴 시간과 많은 비용이 필요하다. DemoStart는 로봇 팔 학습을 물리 시뮬레이터 내에서 실행하는 접근 방식을 채택한 학습 방법으로 학습에 필요한 시간과 비용을 절약할 수 있다.
DemoStart에서는 물리 엔진 MuJoCo 내에 로봇 팔 부품과 작업을 재현해 학습을 실행한다. 물리 시뮬레이션과 현실 세계 사이에는 작은 차이가 존재하지만 DemoStart는 이 차이를 메우기 위한 커리큘럼을 자동 생성해 물리 시뮬레이션에서의 학습 결과를 원활하게 현실 세계 동작에 반영할 수 있다.
구글은 이미 Shadow Robot 제조 로봇 팔인 DEX-EE를 사용해 DemoStart를 테스트했다고 한다. 관련 내용은 이곳에서 확인할 수 있다.