테크레시피

멀티플레이도…다양한 게임을 인간처럼 플레이하는 AI?

바둑 AI인 알파고(AlphaGo), 단백질 구조 해석 알고리즘인 알파폴드(AlphaFold)를 개발한 것으로 알려진 AI 개발 기업인 딥마인드(DeepMind)는 전혀 규칙이 다른 게임에도 대응할 수 있는 AI를 개발했다고 발표했다.

딥마인드가 개발한 바둑 AI인 알파고는 이세돌 9단을 이긴 뒤에도 발전을 계속해 2017년에는 바둑 뿐 아니라 체스 등 대국에도 대응한 알파제로(AlphaZero)로 발전했다. 알파제로를 통해 변칙 규칙을 학습시켜 새로운 체스 규칙을 만들어내는 시도도 이뤄지도 있다.

하지만 딥마인드에 따르면 알파제로는 바둑과 장기, 체스 등 여러 게임을 지원하지만 게임마다 다른 학습을 해야 한다. 딥마인드는 이런 알파제로 한계를 극복하고 적응력이 높은 AI 에이전트를 개발하는 방법을 모색했다며 새로 개발한 AI는 특정 작업에 특화하는 게 아니라 많은 작업에 널리 적용할 수 있는 동작을 배울 수 있으며 이는 변화하는 상황에 빠르게 대응할 수 있는 AI를 개발하는데 AI 개발을 위한 중요한 단계라며 모든 게임에 대응 가능한 AI 개발을 발표했다.

이번에 개발한 AI는 1인칭 시점 캐릭터를 조작하도록 설계해 깃발 잡기 게임이나 숨바꼭질, 컬러 매칭 게임 등 멀티 플레이 게임에서 비교적 간단한 목표를 달성하는 방법을 학습했다. AI에게 주어진 목표는 깃발 잡기 게임에선 노란 입방체를 정해진 장소에 옮기고 숨바꼭질에선 적 플레이어 시야에 들어가지 않는 것, 컬러 매칭 게임에선 같은 색 물체 가까이로 가는 등 학습은 게임마다 다르다. 또 게임 무대는 프로그램에 의해 임의로 변경 가능하며 AI는 자신이 조작하는 캐릭터 주위 색 정보에서 스테이지 맵을 파악하는 방법도 학습한다.

이 방법으로 AI에 2,000억 회 학습을 한 결과 AI가 특정 작업에 대해 고도로 최적화된 동작이 아니라 인간처럼 경험적으로 판단하는 동작을 나타내게 됐다고 한다. 또 AI는 지도상 물체를 이용해 다른 플레이어 시야를 가리는 등 멀티플레이 특유 움직임도 습득했다. 딥마인드는 연구에 관심을 가진 사람들에게 연구 참여도 호소하고 있다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독