구글이 자연어 지시에 따라 다양한 게임을 플레이할 수 있는 AI SIMA(Scalable Instructable Multiworld Agent)를 발표했다.
구글은 그동안 바둑, 아타리, 스타크래프트2 등에서 인간 이상 실력을 보이는 AI를 만들어왔다. 이번에 개발한 SIMA는 기존 AI와 달리 높은 점수를 내거나 인간에게 이기는 게 아니라 인간 지시에 따라 플레이하는 것을 목표로 한다.
개발팀은 “SIMA는 게임에서 이기도록 훈련된 것이 아니라 지시된 대로 행동하도록 훈련됐다“며 ”한 게임만 플레이하는 것도 AI에게는 큰 기술적 업적이지만 다양한 게임에서 지시를 따르는 법을 배운다면 어떤 환경에서도 유용한 AI 에이전트가 될 수 있을 것”이라고 밝혔다.
구글은 SIMA 개발을 위해 8개 게임 스튜디오와 협력해 고트 시뮬레이터 3(Goat Simulator 3), 하이드로니어(Hydroneer), 노 맨스 스카이(No Man’s Sky), 새티스팩토리(Satisfactory), 발하임(Valheim) 등 9개 게임 플레이 방법을 SIMA에게 학습시켰다.
AI 훈련에서는 먼저 유니티로 구축한 환경에서 기본적인 객체 움직임을 배운 뒤 실제 인간 게임 플레이를 관찰하며 학습했다. 인간 중 1명이 게임을 플레이하고 다른 1명이 다음 행동을 지시하거나 1명이 자유롭게 게임을 한 뒤 자신의 행동에 대해 설명하는 방식을 사용했다.
이렇게 학습한 SIMA는 “소행성을 쏴라” “자원을 채취해라” “울타리를 넘어라” 등 언어 지시에 따라 600가지 간단한 태스크를 10초 이내에 수행할 수 있게 됐다.
주목할 점은 9개 게임 전체에서 훈련받은 SIMA가 특정 게임 전문 에이전트보다 67% 높은 성능을 보였다는 것이다. 학습 데이터에 다른 게임이 포함되어 있으면 그렇지 않은 경우보다 성능이 크게 향상됐다.
개발팀은 더 폭넓은 훈련을 통해 보다 범용적이고 다용도 AI를 만들고 궁극적으로는 자재를 구해 캠프를 짓는 등 복잡한 태스크도 수행할 수 있게 하는 게 목표라고 한다. “결국 온라인뿐 아니라 현실 세계에서도 다양한 태스크를 이해하고 안전하게 수행할 수 있는 더 일반적인 AI 시스템과 에이전트를 구축할 수 있도록 연구를 계속할 것”이라는 설명이다. 관련 내용은 이곳에서 확인할 수 있다.