테크레시피

AI 게이머, 스타크래프트II 상위 0.2%에 들었다

알파벳 산하 AI 개발 기업인 딥마인드가 개발한 알파스타(AlphaStar)가 스타크래프트II 랭킹에서 3개 종족 모두 그랜드 마스터 수준에 도달했다. 그랜드 마스터는 이 게임의 최상급 레벨 플레이어가 모이는 리그의 호칭으로 알파스타의 순위는 상위 0.2%에 들어 있다.

알파스타는 지난 1월 인간 톱플레이어 2명에게 승리했다는 보도가 나왔지만 당시 일부 언론에선 공정성에 의문이 남는다는 평가를 하기도 했다. 게임 UI 그러니까 모니터 영상을 보고 마우스와 키보드 입력을 이용해 조작한다는 점에서 인간보다 AI가 우세하다는 지적이었다.

알파스타는 이후 스타크래프트II를 플레이할 때 컴퓨터 측에서 특별한 신호 등을 받는 게 아니라 모니터에 비춘 카메라 영상으로 주위 상황을 알 수 있는 맵 정보를 확인하도록 인간처럼 제한됐다. 또 마우스와 키보드 입력도 인간이 할 수 있는 속도로 제한을 걸었다. 이런 조건에서 프로게이머가 스타크래프트 훈련하는 모습을 모방해 강화학습을 해온 것이다.

또 지금까지 AI 학습 과정에서 딥마인드는 AI에 이길 가능성을 극대화하는 걸 중요시한 게임 플레이를 해왔다. 그냥 전체 상위 5%에 넣는 실력을 갖추는 건 가능했지만 이보다 더 올라가려면 알고리즘을 바꿀 필요가 있다고 보고 모든 에이전트가 승리를 목표로 하는 게 아니라 여기는 나에게 맡기고 앞으로 가라는 팀을 위한 희생을 기꺼이 하는 자질을 가진 에이전트를 추가하기도 했다.

이렇게 프로토스와 테란, 저그로 이뤄진 3개 종족을 모두 AI로 훈련시킨 결과 알파스타는 모든 종족의 그랜드 마스터에 도달해 인간 게이머 중 99.8%를 이길 수 있게 됐다는 것이다.

물론 딥마인드 측은 알파스타의 훈련 속도는 아직도 인간의 능력에 미치지 않는다고 밝히고 있다. 또 딥마인드는 장기적으로 실시간 전략 게임의 복잡한 상황 판단을 적용할 수 있는 자동운전이나 로봇 활용 등을 고려하고 있다. 일반 AI가 대처할 수 없는 비정상적인 사태도 잘 벗어날 수 있는 AI를 목표로 하고 있는 것이다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독