구글 딥마인드 로봇공학팀이 로봇에 간단한 명령을 내리는 것만으로 태스크를 실행해주는 연구 성과를 발표했다. 그 중 트레이닝 데이터 수집 시스템인 오토RT(AutoRT)에는 아이작 아시모프의 로봇 3원칙을 바탕으로 한 로봇 헌법이 포함되어 있다고 한다.
오토RT는 현실에서 유용한 로봇을 생산하기에 적합한 교육을 제공하는 더 실용적이고 다양한 교육 데이터를 수집하는 시스템. 실제로 7개월간 실증 실험으로 다양한 빌딩에서 로봇 20대를 동시에 제어하고 로봇 52대로 6,650개 독특한 태스크에 걸쳐 7만 7,000회 시도로 이뤄진 다양한 데이터세트로 수집할 수 있다.
로봇은 형태가 다양하지만 이번 실험에서 이용한 로봇은 카메라, 암, 이동 베이스로 이뤄지는 간단한 것으로 카메라로 포착한 영상을 바탕으로 시각언어모델 VKM이 환경으로 보이는 물체를 이해한다. 대규모 언어 모델 LLM은 로봇이 실행 가능한 창조적 태스크 목록을 만들고 여기에서 실행해야 할 적절한 태스크를 선택한다는 의사결정자 역할을 했다고 한다.
현실에서 로봇이 움직이는데 중요한 건 안전성이다. 아이작 아시모프는 로봇은 인간을 다치게 하지 말아야 한다, 처음 원칙에 위반되지 않는 한 로봇은 인간 명령을 따라야 한다, 앞의 원칙에 위반되지 않는 한 로봇은 스스로를 지키지 않으면 안 된다는 로봇 3원칙을 제시한 바 있다.
오토RT는 이 3원칙에 영감을 얻은 로봇이 작업을 수행할 때 준수해야 할 로봇 헌법을 의사결정자 그러니까 LLM에 제공한다. 더구나 안전 규칙에서 인간이나 동물, 날카로운 것, 전기 제품에 관련한 작업을 로봇이 시도해선 안 된다는 것도 정해져 있다고 한다.
하지만 이런 로봇 헌법이나 안전 규칙이 있어도 안전성은 보증되지 않아 오토RT에는 관절에 걸리는 힘이 일정 이상이 되면 자동 정지한다는 등 대책이 포함되어 있으며 모든 활성 로봇은 물리적 킬스위치를 가진 인간 감시자 시야 내에 유지된다고 한다.
그 밖에 구글 딥마인드는 트랜스포머 모델 효율화를 한층 더 실현하는 SARA-RT, 학습용 영상에 시각적 윤곽을 추가해 로봇 움직임 일반화를 돕는 RT-Trajectory를 발표했다. 관련 내용은 이곳에서 확인할 수 있다.