테크레시피

화재 난 알리바바 클라우드, 신중하게 건조중

알리바바 클라우드(Alibaba Cloud) 데이터 센터에서 리튬이온 배터리 폭발로 인한 화재가 발생하여 네트워크 장애가 발생했다. 이 소화 활동으로 인해 데이터 센터 장비가 물에 잠겨버렸기 때문에 알리바바 클라우드는 데이터 센터에서 젖은 장비를 반출해 건조하고 복구를 서두르고 있다고 보고하고 있다.

지난 9월 10일 11시 20분 알리바바 클라우드 모니터링 시스템이 싱가포르 리전 Zone C에서 네트워크 접속 이상을 감지했다. 알리바바 클라우드 엔지니어가 조사한 결과 싱가포르 데이터 센터에서 리튬이온 배터리가 폭발해 화재가 발생했음이 밝혀졌다. 같은 날 10시 55분 시점 이미 소방관에 의한 소화 활동으로 진화됐다고 한다.

이후 12시 30분에는 Cloud Database Redis/MongoDB/RDS MySQL, OSS, OTS 등 클라우드 제품 재해 복구가 정상적으로 완료됐다고 한다. 하지만 14시 40분 영향을 받은 데이터 센터 화재 상황은 기본적으로 통제되고 있지만 시설 내 온도는 여전히 높은 상태라고 알리바바 클라우드는 보고하고 있다.

20시 4분 시점 화재 경보는 완전히 해제되지 않았으며 데이터 센터 내 일부 네트워크 장비에서 고온 환경으로 인한 이상이 발생했음이 밝혀졌다. 9월 11일 1시 46분 알리바바 클라우드는 현지 소방서 요청에 따라 소화 활동 물 뿌림이 계속되고 있어 서버룸에 물이 고여 누수가 발생하고 전기 합선 위험이 생겼다며 Zone C 서버 빌딩에서 전원 긴급 차단을 실시했다고 보고했다.

데이터 센터의 소화 활동을 담당한 싱가포르 민간방위대(SCDF)는 화재는 4층 건물 3층에 있는 배터리실에 보관되어 있던 리튬이온 배터리와 관련이 있었다며 진화를 위해 제트 방수를 실시하고 무인 소방 로봇도 동원했다고 말했다.

소화 활동은 꼬박 하루 동안 계속됐고 알리바바 클라우드 엔지니어는 9월 12일 17시 25분 시점에 드디어 데이터 센터 1층 영역에 접근이 허가됐다. 이후 하드웨어 설비 안전 이전 작업이 진행되고 있지만 9월 16일 15시 시점에 데이터 센터 일부 영역은 봉쇄되어 접근할 수 없는 상태라고 한다.

알리바바 클라우드는 영향을 받은 하드웨어와 기계 일부는 건물 내 접근이 금지된 위험한 봉쇄 구역에 있으며 일부 하드웨어와 기계는 데이터 보안을 확보하기 위해 신중하게 건조시킬 필요가 있다며 이전한 장비에 대해서도 신중하게 건조를 한 후 배선해 전원을 투입하고 검증을 실시하고 있다고 한다.

싱가포르 데이터 센터 상태를 확인해보면 지금도 일부 서비스에서 네트워크 장애가 계속 발생하고 있는 상태다.

한편 이 화재 영향으로 알리바바 EC 플랫폼인 라자다(Lazada)나 틱톡 등 알리바바 클라우드에 의존하는 일부 서비스에 장애가 발생했다고 한다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사