테크레시피

단어를 로봇개 동작으로 변환해주는 AI

구글 딥마인드가 단어를 바탕으로 4족 보행 로봇 동작을 만드는 방법을 고안했다. 더구나 면령이라고는 할 수 없는 모호한 말에도 제대로 반응한다고 한다.

구글 딥마인드 연구팀이 개발한 건 언어를 4족 보행 움직임으로 변환하는 방법인 세이탭(SayTap). 인간의 말을 로봇개가 이해할 수 있는 형태로 번역해주는 것이다. 로봇에 앞으로 걸으라는 움직임이 사전에 입력되어 있지 않아도 앞으로 걸으라고 말하면 그대로 움직여준다는 것. 앞으로 걸으라거나 뒤로 돌아 같은 구체적인 말 뿐 아니라 다람쥐를 잡으라든지 지면이 뜨거우니 서두르라는 식 지시에도 어떻게 움직이면 좋을지 이해할 수 있다고 한다.

대규모 언어 모델은 고성능을 보여줬지만 관절 각도 목표와 모터 토크 같은 저수준 명령어를 이해하는 건 여전히 어렵다. 이번 연구는 발 접지 패턴을 자연어로 인한 인간 명령과 이런 저수준 명령을 출력하는 운동 제어 장치 인터페이스로 제시한다. 그 결과 4족 보행 로봇을 위한 인터랙티브 시스템이 가능해져 사용자는 다양한 거동을 유연하게 생성할 수 있게 된다.

연구팀은 말에서 요구되는 개 움직임을 전후좌우 다리 접지와 비접지 패턴으로 표현해 로봇도 알 수 있는 형태로 바꿨다. 다리를 땅에 붙인 상태=1, 발을 띄운 상태=0으로 하고 4개 다리 각각 상태를 1과 0으로 나타내면 특정 시점 개 상태를 4자리 1과 0으로 표현할 수 있다. 예를 들어 전부 다리가 지면에 붙어 있으면 1111, 점프한 순간은 0000, 걷는 상태라면 0110, 1001을 교대로 반복하는 상태다.

로봇개에게 앞으로 천천히 걸으라고 명령하면 해당 명령을 발 1, 0 접지 패턴으로 변환한다. 이 접지 패턴이 로봇개 운동 제어 장치에 입력되고 제어 장치는 개 발에 대한 명령을 출력해 발이 그대로 움직이게 된다.

세이탭이 더 대단한 건 구조화되어 있지 않은 모호한 지시에도 대응할 수 있다는 것이다. 예를 들어 피트닉을 가자는 개 동작을 명시하지 않은 말에 대해 로봇개는 점프를 하는 등 바람직한 반응을 보인다. 또 지면이 뜨거운 것처럼 움직이라는 지시나 다람쥐에서 멀리 떨어지라는 지시에도 따른다.

세이탭을 자연어와 저수준 제어 장치 사이 새로운 인터페이스로 원하는 발 접지 패턴을 제안한다. 연구팀은 이 새로운 인터페이스는 간단하고 유연하며 로봇에 대한 직접적 지시에도 어떻게 반응해야 하는지 명시하지 않은 지시에도 따를 수 있다고 말한다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독