테크레시피

AI, 이번에는 100m 달리기 게임도 승리

AI가 또다시 인간을 뛰어넘었다. 이번에 AI가 도전한 분야는 주자를 달리게 하는 게임인 QWOP다. QWOP는 키보드에서 Q·W·O·P 키를 타이밍 좋게 눌러 주자가 달려가게 하는 것이다. 웨슬리 랴오(Wesley Liao)가 개발한 AI는 100m 완주를 해 인간이 가진 가장 빠른 기록을 시원스럽게 앞질러 버렸다고.

이 AI는 크게 2단계로 개발했다. 첫 단계는 제대로 달리는 걸 자체 학습으로 몸통을 내리지 않고 동체 수직 운동을 억제하고 무릎을 굽히지 않는 등 동작을 피하게 프로그래밍되어 있었다. 개발 과정에서 QWOP 게이머와 협력하고 알고리즘은 구글 산하 딥마인드가 개발한 ACER 학습을 통해 65시간을 훈련시켰다. 이 단계에서 AI 기록은 1분 8초. 인간의 가장 빠른 기록은 참고로 48.34초였다.

이어 다음 단계로 속도를 더하고 평가하도록 학습 방법을 채택하고 알고리즘도 딥마인드의 다른 것(Prioritized DDQN)으로 바꿨다. 새로운 AI는 인간의 가장 빠른 기록을 깰 47.34초를 냈다고 한다. 학습에 걸린 시간은 40시간이며 사전 교육은 몇 분 정도였다. 이 AI는 인간 기록을 넘어섰지만 불행하게도 순위 사이트인 스피드런닷컴(Speedrun.com)은 인간만을 대상으로 하며 소프트웨어를 이용한 플레이 결과는 올려주지 않는다고 한다. 관련 내용은 이곳에서 확인할 수 있다.