딥마인드가 새로 협상에 의한 합의 형성이 중요한 보드 게임인 디플로메시(Diplomacy)로 커뮤니케이션을 실시해 다른 에이전트에 승리할 수 있는 AI를 발표했다.
이 게임은 제1차세계대전 전야 유럽을 무대로 한 보드 게임. 유럽 열강 7개국을 담당하는 각 플레이어는 타국과 적극적으로 외교를 하고 동맹을 해가며 공통의 적을 쓰러뜨리거나 때론 맹방을 배반하는 행위가 요구된다.
체크나 바둑 등 1:1 게임으로 인간에게 승리를 거둬온 AI에게 다른 플레이어와의 복잡한 의사 소통이나 다른 플레이어가 약속을 지키는지 깨는지를 알아차리는 논리적 사고를 익히는 건 오랫동안 중요한 과제였다. 따라서 딥마인드 연구팀은 먼저 AI 에이전트가 다양한 합의 하에 게임이 어떻게 전개되는지를 시뮬레이션해 서로 유익한 협상을 선택할 수 있는 알고리즘을 도입했다.
하지만 이 게임은 약속이 반드시 지켜지는 건 아니기 때문에 에이전트는 다른 플레이어와 동맹을 맺기 위해선 전략적으로 계약을 깨면 어떻게 될지 예측할 필요가 있다. 이 과제에 대처하기 위해 연구팀은 한 번 맺은 약속을 깨면 어떻게 신뢰 관계와 협력 관계가 손상되는지 조사한 뒤 약속을 깨는 상대방으로부터의 보복을 예측하거나 이런 보복보다 배신에서 얻은 이익이 충분히 큰 경우에만 배신하는 것 등을 AI에 학습시켰다.
이를 통해 딥마인드 AI는 다른 에이전트와 커뮤니케이션을 하고 계약을 맺고 게임을 유리하게 전개할 수 있게 되어 협상 능력을 가지 않는 에이전트에 승리할 수 있었다고 한다.
연구팀은 이번 연구에 대해 공평성과 투명성을 가진 신뢰할 수 있는 AI 구축은 중요한 주제이기 때문에 디플로메시 같은 샌드박스에서 이런 문제를 연구하는 건 실세계에 존재하는 가능한 협력과 경쟁 사이의 격렬함을 더 깊이 이해하는데 도움이 될 것이라고 밝혔다.
복잡한 전략을 구사하는 AI 능력은 발전하고 있다. 올해 12월 딥마인드 AI인 딥내시(DeepNash)가 군인 장기 일종인 스트라테고에서 전문가를 이기는데 성공했다. 또 메타 AI인 시세로(Cicero)는 온라인 대전에서 디플로메시를 플레이해 상위 10%에 오르는 성적을 거두기도 했다. 관련 내용은 이곳에서 확인할 수 있다.