테크레시피

인간 수준에 또 도달한 AI 게임 스킬

알파벳 산하 딥마인드 리서치팀이 개발한 AI인 딥내쉬(DeepNash)의 전략 보드 게임인 스트래티고(Stratego) 스킬이 인간 프로 수준까지 높아졌다고 한다. 딥내쉬의 AI간 게임 승률은 97%에 이르는 압승, 인간과의 온라인 대전에서도 무려 승률 84%에 이른다. 팀이 아는 한 스트래티고에서 이 정도까지 레벨을 높인 AI는 이게 처음이라고 한다. 딥내쉬는 자가 대전을 계속 해가면서 스킬업해가는 타입이어서 지금까지 나온 AI에선 생각하지 못하던 전략을 검토하거나 복잡한 결단이 가능하다는 것.

스트래티고가 AI 학습에 적합하냐는 의견도 있지만 불완전한 정보의 불완전한 유입과 장기적 결단력이라는 이 게임이 주는 독특한 요소가 AI에게 독특한 실험이 되고 있다고 한다. 상대방 수가 뭔지 모르기 때문에 예상을 근거로 한 무수한 손을 생각할 수 있다. 연구팀에 따르면 스트래티고는 텍사스 홀덤 포커나 바둑보다 지금 생각할 수 있는 상황의 수가 많다고 한다.

스트래티고에서 이기려면 AI는 장기적 전략과 단기적 결정을 동시에 진행해야 하지만 지금까지 AI에선 제한된 불확실한 정보를 바탕으로 결정하고 장기적인 전략을 세우는 건 어렵고 거의 불가능하다. 딥내쉬는 이를 잘 처리할 수 있는 희귀한 AI라고 할 수 있다.

딥내쉬는 이름처럼 미국 수학자 존 내쉬와 게임 이론인 내쉬 균형(Nash’s Equilibrium)에서 영향을 받은 AI다. 자신의 플레이와 모델 프리 강화형 러닝 알고리즘인 R-NaD를 결합해 스트래티고에 내쉬 균형을 도입하고 있다. 알고리즘과 딥러닝 구조를 모두 사용한 것이다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독