스타크래프트2 경기 나선 AI

구글 산하 AI 개발사인 딥마인드(Deepmind)는 바둑 AI 알파고로 이세돌 9단을 이겨 눈길을 모은 바 있다. 그런데 이번에는 AI를 이용해 컴퓨터 게임에 도전장을 내고 유명 실시간 전략 게임인 스타크래프크2(StarCraft II)로 장소를 옮겼다.

이렇게 개발한 AI인 알파스타(AlphaStar)가 지난 1월 25일(현지시간) 프로게이머와 스타크래프트2 경기를 벌였고 승리를 했다. 알파스타는 게임에 대한 루틴을 알파스타 리그(AlphaStar League)라고 불리는 교육 프로그램을 통해 훈련한다. 인간 게이머의 기록을 학습시키고 AI는 2개로 이를 분할, 서로 대전을 하면서 훈련을 거듭한다. 일주일 동안 학습을 반복했는데 딥마인드에 따르면 알파스타는 스타크래프트2를 200년간 훈련시킨 꼴이라고 설명하고 있다.

이를 통해 알파스타는 딥마인드가 선별한 에이전트 5개로 세계 랭킹 42위 TLO와 경기를 벌여 5전 전승을 기록했다. TLO는 알파스타가 본 적도 없는 전략을 취했다면서 지금까지 개발된 게임용 AI와는 차원이 다르다고 밝혔다.

딥마인드는 이 경기에서 얻은 지식 데이터를 추가 학습한 알파스타를 준비해 13위 상위 랭킹과 2차례에 걸쳐 스타크래프트2 토너먼트에서 우승한 게이머에 도전했다. 이 경기 해설자는 마치 AI가 인간처럼 생각하고 플레이하면서 판단과 전술 스타일을 상황에 따라 조절하면서 상대방의 예상과 다른 전술을 보였다고 평했다. 그 결과 알파스타는 프로게이머와의 게임에서 10전 전승을 거뒀다.

다만 여기까지는 인간 게이머에게 유리한 점이 있었다. 스타크래프트2 데이터 문제지만 알파스타는 게임 맵 모두에 동시 액세스할 수 있어 추가 정보를 얻을 수 있었다. 인간은 기본적으론 화면 밖 범위를 볼 수 없어 인간 쪽에 큰 핸디캡이 존재했던 것. 1월 24일 재대결에선 딥마인드는 알파스타의 새로운 버전을 내놨는데 이 버전은 이전처럼 게임 정보를 직접 게임 엔진에서 받는 게 아니라 카메라를 이용해 인간과 마찬가지로 화면 정보만 이용해 게임을 하도록 사양을 바꿨다. 이 새로운 버전은 일주일 훈련을 했지만 결국 인간 프로게이머에게 패했다.

그럼에도 알파스타가 획득한 높은 전문 지식과 압도적인 학습 속도는 스타크래프트2 프로게이머에게는 안 좋은 소식일 수 있다. 다만 게이머는 AI가 게임에 대한 200년 이상 누적 지식을 활용해 효과적인 전략을 알아내게 될 가능성도 있다. 관련 내용은 이곳에서 확인할 수 있다.