테크레시피

클라우드 서비스 멈춰 세운 기록적 열파

올해는 7월 3주차 경부터 유럽에서 과거 전례 없던 심각한 열파가 습격해 스페인이나 포르투갈에선 열파 영향으로 1,700명 이상이 사망했다. 이런 열파는 사람 뿐 아니라 디지털 기기에도 영향을 미치고 있으며 구글 클라우드나 오라클 클라우드 등 클라우드 서비스가 정지하는 사태까지 발전하고 있다.

유럽을 공격한 열파로 인해 지난 일주일간 영국은 기록적인 무더위에 휩쓸리고 있다. 현지 시간 7월 19일에는 사상 처음으로 섭씨 40.2도라는 기온을 기록했다. 이 무더위 탓에 구글과 오라클 클라우드 인프라를 호스팅하기 위한 데이터센터 냉각 시스템이 작동하지 않아 구글 클라우드와 오라클 클라우드가 중단되는 상황에 빠진 것.

구체적으로 구글과 오라클은 하드웨어 구성 요소가 영구 손상되어 장기적으로 서비스가 중단되는 걸 방지하기 위해 데이터센터를 종료하기로 결정했으며 대신 클라우드 서비스가 중단된 흐름이다.

처음 클라우드 서비스가 중단된 건 오라클로 회사 측은 19일 11시 30분경 데이터센터에서 냉각 시스템 장애를 보고하고 중요하지 않은 하드웨어 전원을 떨어뜨렸다고 설명하고 있다. 오라클은 영국 기온으로 인해 사우스런던 데이터센터 내 냉각 인프라에서 문제가 발생했다며 제어되지 않은 하드웨어 장애를 방지하기 위해 서비스 인프라 구조 일부 전원을 꺼야 했다고 밝혔다. 이 대처에 대해 오라클은 이번 조치는 고객엑 장기적 영향을 미칠 가능성을 줄이기 위해 이뤄진 것이라고 설명하고 있다.

오라클 보고 2시간 이후 구글 유럽 서부2(europe-west2) 서버 호스팅하던 건물 안에서 냉각 시스템이 장애를 일으켜 똑같이 클라우드 서비스가 정지되는 사태가 발생했다. 구글은 장애에 대해 냉각 관련 장애로 인해 대상 영역 용량에 부분적 장애가 발생하고 가상머신이 종료되고 일부 고객 머신이 손실됐다고 설명하고 있다.

더구나 구글은 자사는 냉각 시스템을 온라인으로 되돌려주고 해당 지역에서 용량을 만들기 위해 노력 중이라며 내부 가상머신은 영향을 받지 않아야 하며 복제된 영구 디스크 장치 중 일부는 단일 중복 모드로 실행 중이라고 밝혔다. 구글은 또 머신 손상과 장시간 정지를 방지하기 위해 일부 구역 머신을 끄고 GCE(Google Compute Engine) 선점형 시작을 제한했다고 발표했다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사