아기는 태어나서 처음으로 자신의 발로 서려면 부모의 도움이 필요하지만 시행착오와 경험을 반복하면서 감각을 기억하고 결국 걸을 수 있게 된다. 반면 보스턴다이내믹스 같은 곳이 선보인 아틀라스와 스팟 같은 첨단 로봇은 인간과 동물에 가까운 운동 능력을 갖췄지만 기본 동작은 프로그래밍된 것으로 스스로 서는 방법이나 걷는 방법을 학습한 건 아니다. 따라서 소프트웨어에 상정하지 않은 상황에 빠지면 스스로 정상 상태로 복귀할 수 없을 수도 있다.
중국절강대학과 스코틀랜드 에딘버러대학 연구팀이 사족보행로봇이 넘어진 상태에서 스스로 일어서는 방법을 기억하기 위해 소프트웨어에서 AI를 강화학습하는 방법을 개발했다.
기술의 경우 예를 들어 보행이나 균형 등 8가지로 나눈 AI 신경망을 각각 훈련시키는 소프트웨어를 통해 로봇 강아지가 작업을 잘 처리하면 디지털 보상 포인트를 줬다. 반대로 잘못하면 처벌이 아니라 단점 포인트를 주고 재발하지 않게 기억하도록 했다. 이를 반복해 연구팀은 8가지 기술 각각에 대한 AI를 만들었다.
연구팀은 그 다음 8가지 AI를 통솔해 우선순위 네트워크를 구축하는 사령탑 역할을 만들고 어떤 기술을 최우선 이상 조합, 어떻게 자세를 제어할지 방법을 지시하는 걸 허용했다. 예를 들어 로봇이 넘어져서 다시 일어서려고 하면 AI 시스템은 이 움직임을 감지하고 신체 균형 처리 전문 AI를 호출해 우선 태세를 갖추게 한다.
디지털 공간에서 로봇 강아지가 넘어지기 쉬운 장애물이 깔린 지역을 걷는 실험에선 로봇이 균형을 잃었을 때 제대로 AI가 자세를 수정시켜주면서 목표물을 쫓아 걷는데 성공했다. 그리고 이 소프트웨어를 실제 로봇 강아지에 탑재하고 같은 자갈 등을 깔아놓은 바닥을 걷게 한 결과 제대로 넘어지지 않으면서 균형을 유지할 수 있었다. 또 연구팀이 막대기로 로봇을 찔러 쓰러뜨린 경우에도 일어서는 기술을 통해 로봇 강아지는 다리를 접고 몸을 수평으로 하고 잘 일어설 수 있었다고 한다.
연구팀은 로봇 AI를 훈련시키기 위해서 시뮬레이션 계산 부하가 너무 높은 게 문제라고 말한다. 실제로 다양한 기술을 기억하게 하고 모든 장면에서 문제없이 행동하게 하려면 아직도 방대한 계산 작업이 필요하며 연산량을 최소화하는 게 앞으로의 과제라고 밝히고 있다.
만일 기술당 AI 연산량을 크게 줄일 수 있다면 예를 들어 축구와 야구를 포지션별 특유 기술을 구사해 플레이할 수 있을 만큼 운동 능력과 응용력이 뛰어난 로봇을 만들 수 있게 될 날이 올지도 모른다. 관련 내용은 이곳에서 확인할 수 있다.