AI 개발 기업인 딥마인드가 개발해 인간 바둑기사를 이겨 화제를 모은 바둑 AI인 알파고(AlphaGo)나 모든 보드 게임을 학습할 수 있도록 진화한 버전인 알파제로(AlphaZero) 핵심 부분이 조용히 깃허브를 통해 오픈소스화되어 있다는 지적이 나왔다.
엔비디아 AI 연구자가 알파고나 알파제로 코어 부분이라고 주장하는 건 딥마인드가 깃허브에 공개하고 있는 JAX 네이티브 구현을 갖춘 라이브러리인 Mctx. Mctx는 입력에 대해 병행해 초고속으로 실행되는 JAX 네이티브 몬테카를로 트리 검색을 제공해 가속기를 최대한 활용해 파라미터화된 학습 환경 모델로 알고리즘을 동작시킬 수 있다고 한다.
몬테카를로 트리 검색은 무작위 시뮬레이션 결과를 바탕으로 탐색 트리를 구축하고 단시간에 정답에 가까운 답을 내는 휴리스틱 알고리즘이다. 몬테카를로 트리 검색은 바둑이나 체스 같은 턴 방식 게임에서 최상의 손을 이끌어내는데 유용하다고 한다.
딥마인드의 Mctx 라이브러리는 알파고 뿐 아니라 바둑 이외 장기나 체스 등 보드 게임에도 대응하는 알파제로나 룰을 모르는 상태에서도 팩맨 같은 게임을 고점수로 낼 수 있는 뮤제로(MuZero)에도 대응한다. 관련 내용은 이곳에서 확인할 수 있다.