구글 리서치가 뉴럴GCM(NeuralGCM)이라는 지구 대기를 시뮬레이션하는 기계 학습 모델을 개발했다고 발표했다. 이 모델은 기존 물리 기반 모델링과 기계 학습을 결합해 시뮬레이션 정확도와 효율성을 향상시켰으며 2~15일간 일기 예보에서 기존 모델보다 더 정확한 결과를 내고 지난 40년간 기온을 더 정확히 재현할 수 있다.
뉴럴GCM은 구글 리서치가 유럽중기예보센터(ECMWF)와 공동으로 개발한 혁신적인 기후 모델. 가장 큰 특징은 기존 물리 기반 모델링 방법과 최신 기계 학습 기술을 융합한 것이다.
기존 기후 모델은 지구를 큰 정육면체로 나누고 각 정육면체 내 기상 현상을 물리 법칙에 기반해 계산했다. 하지만 구름 형성이나 강수와 같은 소규모 현상은 이 정육면체보다 훨씬 작은 규모에서 발생하기 때문에 정확한 시뮬레이션이 어려웠다. 따라서 이런 현상은 파라미터화라고 불리는 간소화된 모델로 근사됐지만 이 방법에는 정확도 한계가 있었다고 한다.
뉴럴GCM은 대규모 현상에 대해서는 기존대로 물리 법칙에 기반해 계산하지만 소규모 현상에 대해서는 기계 학습을 사용해 기존 기상 데이터로부터 학습한다. 구글 리서치는 이 방법으로 기존 모델에서는 포착하기 어려웠던 복잡한 상호작용을 고려할 수 있게 됐다고 보고하고 있다.
구글 리서치는 더 나아가 대규모 현상에서의 알고리즘을 처음부터 재검토하고 JAX라는 기계 학습 프레임워크로 구현했다. 이를 통해 시스템 전체 동작을 온라인으로 최적화할 수 있게 되어 소규모 현상과 대규모 현상에서의 피드백을 고려할 수 있게 됐다고 한다.
뉴럴GCM 성능은 단기 일기 예보부터 장기 기후 예측까지 광범위한 시간 척도에서 기존 모델을 뛰어넘는다는 설명이다. 예를 들어 2~15일간의 일기 예보에서 뉴럴GCM은 ECMWF 첨단 모델보다 95% 확률로 높은 정확도를 보였다고 한다. 또 1980년부터 2020년까지 40년간 기온 예측에서는 기존 대기 모델 평균 오차가 0.75℃였던 것에 비해 뉴럴GCM에서는 평균 오차를 0.25℃로 줄일 수 있었다고 한다.
계산 효율성 면에서도 뉴럴GCM은 큰 진전을 이뤘다고 한다. 예를 들어 고해상도 물리 기반 모델인 X-SHiELD와 비교하면 뉴럴GCM은 3,500배 이상 빠르고 계산 비용도 10만분의 1로 줄일 수 있었다고 한다. 이는 고성능 컴퓨팅 분야에서 25년분 진보에 해당하는 개선이라고 강조하고 있다.
구글 리서치는 이 모델 소스 코드와 모델 가중치를 비상업적 사용을 위해 깃허브에서 공개하고 있으며 다른 연구자가 새로운 요소를 추가해 가설을 테스트하거나 모델 기능을 개선할 수 있도록 하고 있다. 관련 내용은 이곳에서 확인할 수 있다.