테크레시피

인공지능이 데이터센터 열 식힌다

데이터센터에도 인공지능 기술 도입이 늘어날 가능성이 높아지고 있다. 지난 2010년 구글이 인수한 영국 인공지능 개발사인 딥마인드(DeepMind)는 2016년 구글 데이터센터의 냉각 효율을 AI를 통해 40% 절감하는 데 성공했다고 발표하기도 했다.

전 세계에 있는 구글 데이터센터는 구글 검색이나 지메일, 유튜브 같은 구글 서비스의 원활한 지원을 돕는 역할을 한다. 데이터센터 효율을 끌어올리는 건 구글 서비스의 품질 향상으로 이어지는 건 물론이다. 구글은 이런 이유로 데이터센터 시스템을 꾸준히 업데이트하고 있다.

데이터센터의 품질을 말할 때 중요한 것 중 하나가 바로 냉각 효율이다. 엄청난 열을 발생시키는 데이터센터에 맞게 냉각해주는 건 다시 말하면 데이터센터가 안정적으로 작동하는 데 중요하기 때문이다.

그 뿐 아니라 데이터센터 냉각에 필요한 에너지는 데이터센터가 사용하는 에너지 대부분을 차지한다. 냉각 에너지를 절약한다는 건 환경 부하를 낮추는 데에도 도움이 된다. 따라서 구글은 냉각 효율을 높이고 에너지를 절감하기 위한 노력을 계속 해온 것이다.

하지만 데이터센터 냉각 시스템은 데이터센터를 구성하는 기기가 너무 복잡하고 비선형적인 상호 영향을 미치는 탓에 이론이나 인간의 직관 만으론 해결하기 어렵다는 문제가 있다. 전 세계에 위치한 데이터센터 자체가 환경이나 아키텍처가 제각각이어서 최적화된 냉각 모델을 하나 개발하도 다른 센터에 적용할 수 없다는 현실적 어려움도 있다. 이런 이유로 지금은 데이터센터 냉각 시스템 효율이라고 해봐야 일반적인 수준의 프레임워크를 구축하는 데 그친다. 그만큼 데이터센터 냉각 시스템 전체를 효율화하는 건 어려운 일이다.

구글은 2014년부터 머신러닝을 데이터센터 냉각 효율 향상에 접목, 머신러닝을 통해 데이터센터 사용량을 예측하는 모델로 효율성을 높이려는 시도를 해왔다. 딥마인드는 2016년 여기에 참여해 엔지니어 수천 명이 수집한 데이터센터의 온도와 전력, 냉각 펌프의 냉각수 유속 같은 데이터를 딥러닝을 통해 분석, 효율성을 끌어올리는 프레임워크를 만들었다. 그 결과 냉각 시스템 소비 전력을 일정하게 40% 줄이는 데 성공한 것이다. 에너지 지표인 PUE(Power Usage Effectiveness) 15% 개선에 해당하는 것이다.

2016년 발표 이후에도 데이터센터 냉각 시스템 개선을 계속해온 구글이 최근 완전히 인공지능이 제어하고 인간의 손을 필요로 하지 않는 냉각 시스템을 도입, 30% 전력을 절감하는 데 성공했다고 발표했다.

구글과 딥마인드는 데이터센터 냉각은 서비스에 지장을 주지 않게 안전한 방법이어야 하지만 동시에 냉각 시스템을 개선해 비용과 탄소배출량 감소를 기대할 수 있어야 한다는 점에서 안전과 고효율 2가지를 고려한 냉각 시스템을 개발했다. 2016년 구글과 딥마인드가 발표한 인공지능을 이용한 냉각 시스템은 AI가 데이터센터 사용 상황을 모델링해서 1시간 뒤 데이터센터 온도를 예측하고 적절한 대책을 제안하는 식이었다. 대량 데이터를 통해 학습한 시스템은 기존 관리자의 경험에만 의존했던 운용에 비해 40% 높은 효율을 달성할 수 있었다. 하지만 당시 방법은 인공지능이 단순한 지시만 할 뿐 실제 제어는 인간이 운영해야 했다. 이런 문제로 인공지능의 지시를 정확하게 따르는 게 힘들었다고 한다.

이번에 개발한 건 인공지능이 냉각 시스템 제어까지 자동으로 수행하는 그러니까 인간의 수작업이 필요하지 않은 냉각 시스템이다. 데이터센터는 환경에 제각각이어서 냉각 시스템을 제어하는 인공지능은 제어하려는 데이터센터에 수천 개에 달하는 센서를 설치하고 5분마다 데이터센터 상황을 기록한다. 이를 통해 얻은 데이터를 분석하고 다양한 잠재적 요소가 에너지 소비에 어떤 영향을 줄지 평가한다. 그리고 나서 인공지능은 가장 효율이 좋다고 평가한 대안을 자동 실행한다. 인간의 수작업 없이 효율적인 냉각 시스템을 운용해내는 것이다.

인공지능은 데이터센터를 안전하게 운용하는 걸 최우선으로 하도록 설계됐다. 불안정한 동작은 아예 자동으로 배제한다. 또 인공지능이 산출한 결과를 그대로 냉각 시스템에 반영하는 게 아니라 데이터센터 운영자가 정의한 데이터센터 내 시스템 내부 안전 제약 항목과 비교하는 과정을 거친다. 이 과정을 거쳐 진짜 냉각 작업을 실행되어도 괜찮다는 게 확인되면 인공지능은 냉각 시스템을 움직이게 된다. 인공지능이 제어하는 냉각 시스템은 일단 로컬 시스템을 통하도록 하는 중복 과정을 둬서 데이터센터 운영자가 인공지능 제어에 개입할 수 있는 여지를 남겨둔 것이다. 물론 인공지능이 제어한 것도 손쉽게 인간이 다시 제어를 복원하거나 이상이 발생하면 장애 조치를 통해 자동으로 다른 시스템으로 전환되도록 하는 등 다양한 안전 대책을 세워두고 있다.

구글은 지난해 8월부터 새로운 인공지능 제어 냉각 시스템을 도입했다. 도입 초기부터 기존 방법과 비교해 12% 효율을 달성할 수 있었다고 한다. 물론 운영을 계속 해오면서 인공지능이 새로운 데이터를 계속 축적하면서 냉각 시스템 효율 개선을 진행했고 올해 7월 기준으로 기존보다 30% 효율화에 성공했다고 한다. 구글과 딥마인드에 따르면 앞으로도 순조롭게 냉각 시스템 데이터가 늘어날 것인 만큼 더 높은 효율화가 가능할 것이라는 설명이다.

인공지능이 직접 제어하는 냉각 시스템은 냉각 비용이나 에너지를 모두 효율적으로 줄일 수 있는 방법이 될 수 있다 구글은 이 같은 데이터센터 냉각 시스템이 첫 시도일 뿐이며 인공지능이 제어하는 냉각 시스템이 다른 산업 시설에도 적용 가능해 지구 온난화 대책에도 좋은 수단이 될 수 있다고 설명하고 있다.

추천기사