로봇, 인간의 손재주를 훔치다

이석원 기자

2018.08.03

다크틸(Dactyl)은 오픈AI(OpenAI)가 개발 중인 로봇팔이다. 로봇팔 자체가 신기할 건 물론 없다. 섀도 로봇(Shadow Robot)이 제작한 로봇팔인 댁스터러스 핸드(Dexterous Hand)를 이용해 손바닥 위에 놓인 물체를 조작할 수 있는 시스템인 것.

다크틸은 손바닥 위에 놓인 매직큐브 같은 걸 대상으로 프로그램 상에서 원하는 면이 보이게 움직이라고 명령을 내리면 손바닥 위에서 매직큐브 같은 걸 굴리면서 작업을 진행한다. 물체를 원하는 면으로 바꾸기 위해선 RGB 카메라 3대를 이용한다. 이를 통해 촬영한 이미지에서 손가락 좌표를 인식한다.

Loading video

다크틸은 놀라울 만한 손재주를 보여준다. 이미 로봇팔이 개발된 건 수십 년 전 얘기지만 로봇팔을 이용해 물체를 효과적으로 제어하는 로봇 제어 분야에는 풀지 못한 숙제가 많았던 게 사실이다. 그 중 하나가 다크틸이 보여주는 섬세한 손가락 움직임. 보스턴다이내믹스 같은 기업이 사람처럼 걷는 주행 동작을 구현하고 있지만 손가락 움직임은 훨씬 더 정교함을 요구한다.

다크틸은 입방체를 손바닥 위에서 회전시키는 방법 같은 걸 독자적으로 짰다. 게임 분야에 활용되고 있는 강화 학습을 활용해 로봇을 통해 현실에서 어떻게 문제를 해결할지 학습을 시켰다고 한다. 로봇팔 자체는 당연히 현실 공간에서 작동하는 것인 만큼 손바닥 위에 있는 물체와 손가락 사이에 일어나는 마찰이나 미끄러짐 등을 직접 관찰할 수 없어 더 큰 변수에 대한 대응을 필요로 한다.

Loading video

다크틸은 물리 시뮬레이션 엔진인 MuJoCo를 이용해 로봇 시뮬레이텨를 만들고 현실에서 로봇팔을 움직이기 전에 가상 공간에서 로봇팔을 움직여가며 강화학습을 진행해왔다. 학습을 할 때에는 매번 미묘하게 다른 조건을 설정하는 도메인 임의추출(domain randomization)이라는 기술을 이용했다고 한다. 다른 조건이란 정육면체와 배경 색상이 다를 뿐 아니라 로봇팔 동작 속도와 입방체의 무게, 로봇팔 사이에 일어나는 마찰계수 등 모든 요소를 다크틸에 학습시켰다는 얘기다.

여러 조건에서 로봇팔의 작동 방법을 학습하기 때문에 다크틸의 손재주는 빠르게 향상됐다고 한다.

학습 과정을 거치면서 입방체를 굴려 원하는 면을 맞추는 작업 성공 횟수는 빠르게 높아졌다. 물론 모션추적을 통해 모든 요소를 무작위로 학습시킨 로봇팔의 작업 성공 횟수는 50회인 데 비해 그렇지 않은 조건에선 성공 횟수는 6회로 줄어든다. 작업 성공 중간값도 무작위라면 13회지만 그렇지 않으면 0회다. 다만 학습에 필요한 시간은 모든 요소를 무작위로 랜덤 처리하면 압도적으로 길어질 수밖에 없다. 무작위가 아니라면 학습시간은 3년 미만이지만 항상 조건이 달라지는 임의 상태로 바꾸면 항상 일정한 성능을 발휘할 수 있는 수준이 되려면 학습 시간은 무려 100년 이상이 된다. 이렇게 무작위로 설정하면 다양한 조건에서 학습을 진행하기 때문에 다크틸은 입방체 외에 다른 모양도 자연스럽게 처리할 수 있게 된다. 오픈AI 연구팀은 더 복잡한 작업을 학습시킬 목표로 세우고 있다고 한다.

다크틸을 개발한 오픈AI는 지난 2015년 AI를 오픈소스화할 목적으로 설립한 비영리연구기관이다. 오픈AI는 AI가 인류에 공헌할 수 있는지 여부를 판단할 수 있는 연구기관이 필요하다는 생각에서 비롯된 것. AI가 특정 기업이나 정부만을 위한 게 아니라 전 세계에 고르게 혜택을 부여할 수 있어야 한다는 게 설립 목적이다.

오픈AI에는 스페이스엑스와 테슬라를 설립한 엘론 머스크, 링크드인 공동 창업자인 리드 호프만, 페이팔 창업자인 피터 틸, 와이콤비네이터 공동 창업자 제시카 리빙스턴 등이 기부를 통해 참여했고 와이콤비네이터 대표인 샘 알트만이 공동 회장을 맡았다.

샘 알트만은 당시 인류의 미래에 가장 중요한 일 중 하나가 AI일 것이라면서 인류에 공헌할 수 있는 AI를 개발하고 연구하는 기관이 오픈AI라고 밝힌 바 있다. 또 비영리기관인 만큼 연구 결과 역시 인류에 공유될 것이라고 밝혔다.

오픈AI는 이후 꾸준히 결과물을 발표해왔다. 2016년 4월에는 AI 훈련 환경을 제공하기 위한 짐(Gym)을 선보인 데 이어 같은 해 다시 AI 학습 플랫폼인 유니버스(Universe)를 선보였다. 유니버스는 AI의 지능을 측정하고 학습하게 하기 위한 소프트웨어 플랫폼이다. 기존 라이브러리인 텐서플로와 테아노를 이용했고 게임이나 브라우저 등 수천 개에 이르는 AI 측정이나 학습에 활용할 수 있다. 학습은 머신러닝 중 강화학습을 통해 학습을 진행한다. 앞서 발표한 짐 환경으로도 변환할 수 있어 호환성이나 연구 개발의 일관성을 유지할 수 있도록 했다.

Loading video

유니버스는 어려운 환경이나 알 수 없는 작업까지 빠르게 학습할 수 있는 플랫폼 제공을 목표로 한 것이다. 지능을 갖춘 AI를 만들기 위한 기본 도구인 셈이다. 유니버스의 소스코드는 깃허브에 공개되어 있다.

화제를 모은 것 중 하나는 바로 인기 게임 도타2(Dota2)에서 인공지능 오픈AI 파이브(OpenAI Five)가 인간에 승리를 거둔 것이다. 오픈AI는 2017년 체스나 바둑보다 훨씬 복잡한 게임인 도타2에서 세계 챔피언과 1:1 대결을 벌여 승리를 거둔 바 있다. 이어 2018년에는 5:5 팀 대항전을 진행할 수 있는 오픈AI 파이브를 선보인 것이다.

이런 게임이 체스나 바둑 같은 턴 방식 게임보다 복잡한 이유는 실시간으로 의사 결정을 해야 하기 때문이다. 오픈AI 파이브는 구글 클라우드를 통해 12만 4,000 코어로 작동하는 환경에서 인간과 팀대항전을 펼쳤다. 오픈AI 파이브는 신경망에 팀전과 가치 예측, 탐사, 기습 공격, 집중, 추적 같은 요소를 학습시킨 다음 항목에 맞춰 캐릭터를 조작하도록 했다. 또 도타2 한 경기당 8만 프레임 정보를 얻을 수 있는데 이 중 4분의 1을 분석하면서 오픈AI 파이브의 학습을 실시했다. 180일 동안 매일 데이터를 학습했다. 오픈AI 파이브는 8월 열리는 e스포츠 대회에 출전할 예정이라고 한다. 이미 지난 6월 인간팀과의 대결해서 승리했지만 이번에는 유명 프로게이머로 이뤄진 인간팀과 5:5 대항전을 하겠다는 것이다.

Loading video

오픈AI는 지난 7월에는 얼굴 사진 2개를 위화감이 전혀 없게 합성하거나 얼굴에 수염이나 미소 등 속성까지 추가할 수 있게 해주는 기술인 글로우(Glow)를 발표했다. 글로우는 이미지 생성 AI로 학습한 이미지에서 자동으로 레이블을 설정한다. 3만 명 얼굴 사진을 학습시키면 미소나 나이, 특성, 금발, 수염 등 라벨링을 알아서 처리하는 것. 물론 이 같은 레이블은 나중에 자유롭게 조작하거나 새로 입력해 이미지에 변화를 주도록 할 수 있다.

글로우는 웃음이나 나이, 금발, 수염 같은 이런 값을 바꿔서 얼굴 사진을 바꿀 수 있다. 앞서 밝혔듯 이미지 2개를 아예 합성하는 것도 가능하다. 글로우 역시 깃허브에 공개되어 있다.

인공지능을 발전시키기 위한 필수 요소로 알고리즘, 학습 데이터, 계산량 3가지를 말한다. 인공지능이 더 정확한 판단을 수행하려면 학습이 필수적이고 학습량이 많을수록 더 고급 판단을 할 수 있게 되는 건 당연하다. 당연히 학습량을 늘리려면 대규모 처리를 해낼 시스템을 요구할 수 있다. 알고리즘이나 데이터 개선 자체는 수치화하기가 사실 쉽지 않다. 하지만 오픈AI가 밝힌 바에 따르면 AI 학습에 이용되는 계산량은 이미 지난 2012년 3.5개월에서 꾸준히 증가, 올해는 30만 배 이상이라고 한다. 계산량 추이만 봐도 인공지능이 얼마나 가파른 속도로 성장하고 있는지를 가늠할 수 있는 것이다. 앞으로 이 같은 추세를 계속될 것으로 보인다. 또 이렇게 성장하는 AI 시장에서 특정 그룹이 아닌 인류에 혜택을 주려는 오픈AI 같은 조직의 가치 역시 높아질 것으로 보인다.

이 글 공유하기:

추천기사