테크레시피

슈퍼컴퓨터 순위 변동이 의미하는 것

지난 6월 말 전 세계 슈퍼컴퓨터 순위를 발표하는 TOP500 발표에선 5년 만의 변화가 있었다. 5년 동안 슈퍼컴퓨터 순위를 석권했던 중국산 순위가 뒤로 밀리고 IBM이 세계에서 가장 빠른 슈퍼컴퓨터 서밋(Summit)을 1위에 올려놓는 등 미국이 선두를 탈환한 것이다.

당시 발표 중 순위권에 이름을 올린 제품을 보면 1위는 서밋. 122.3페타플롭스 성능을 내는 이 제품은 IBM과 엔비디아가 설계한 것으로 오크리지 국립연구소가 보유하고 있다.

서밋은 올해 6월 8일(현지시간) 발표한 따끈따끈한 슈퍼컴퓨터다. 발표 당시 자료를 보면 200페타플롭스 그러니까 초당 200,000조회에 이르는 엄청난 연산 능력을 갖추고 있다. 앞서 밝혔듯 이 슈퍼컴퓨터는 IBM과 엔비디아가 설계한 것이다. 테니스코트 2개 면적 크기에 이르는 이 슈퍼컴퓨터는 풀파워를 쓴다면 13메가와트 전력을 소비한다. 또 서밋 냉각에는 1만 5,000리터에 달하는 냉각수를 이용하며 이를 위한 전용 냉각 시설도 있다.

서밋의 처리 능력은 앞서 밝혔듯 200페타플롭스. 1페타플롭스라고 하면 부동소수점 연산을 초당 1,000조회 할 수 있다는 얘기다. 그러니 서밋은 200×1,000조회에 달하는 부동소수점 연산 성능을 갖췄다는 얘기다. 기존 슈퍼컴퓨터 순위에서 가장 높았던 미국 제품인 타이탄(Titan)보다 8배에 달하는 성능이다.

서밋은 서버 4,608대로 이뤄져 있다. 서버마다 3.1GHz로 작동하는 IBM 파워9 CPU 2개와 엔비디아 테슬라 V100 GPU로 구성되어 있다. 시스템 전체로 따지면 GPU 2만 7,648개를 이용하는 것. IBM과 엔비디아 칩은 PCI익스프레스보다 속도가 10배에 이르는 엔브이링크(NVLink)로 연결했다. 또 시스템 전체에 들어간 메모리는 10페타바이트가 넘는다. 물론 서밋의 장점은 이런 방대함에만 있는 건 아니다. 기존 슈퍼컴퓨터보다 효율적인 처리 능력을 갖췄다. 소비전력 1와트당 15기가플롭스를 처리할 수 있다고 한다.

서밋은 머신러닝과 신경망 등 주로 인공지능 관련 처리를 위해 설계한 슈퍼컴퓨터이기도 하다. 서밋은 인공지능 처리에 최적화한 하드웨어 구성을 해 방대한 빅데이터, 데이터 세트를 분석해 처리하는 속도를 높일 수 있게 해준다. 지능형 서비스나 소프트웨어 개발에 도움을 줄 수 있다. 그 뿐 아니라 암 연구나 핵융합 발전 등에도 엄청난 처리 능력을 활용할 수 있다.

다시 순위로 돌아가면 2위는 중국 선웨이 타이후라이트(Sunway TaihuLight. 太湖之光)로 중국 국립 병렬컴퓨팅기술 연구센터 NRCPC가 개발한 것. 이 슈퍼컴퓨터는 93페타플롭스 성능을 내며 지난 2016∼2017년 2년간 1위를 차지하기도 했다.

3위는 다시 미국 시에라(Sierra)다. 로렌스 리버모어 국립연구소가 사용 중인 시에라는 IBM이 개발했고 71.6페타플롭스 성능을 낸다. 아키텍처 자체는 서밋과 비슷해 파워9 CPU와 엔비디아 테슬라 V100 GPU를 썼고 노드 4,320개로 이뤄져 있다.

4위는 중국 텐허2A호((天河二号, Tianhe-2A)다. 중국 국방과학기술대학교가 개발한 것으로 33.86페타플롭스 처리 능력을 갖췄다. 텐허2의 경우 지난 2013년 TOP500 1위를 차지한 제품이기도 했다. 텐허2는 제온 파이 프로세서로 구축했지만 텐허2A의 경우에는 가속기를 자체 개발한 매트릭스2000(Matrix 2000)을 이용했다. 물론 이런 개선에도 불구하고 순위는 4위로 떨어졌다.

마지막으로 5위는 일본 ABCI(AI Bridging Cloud Infrastructure). 후찌즈가 개발한 것으로 인공지능 처리를 위한 슈퍼컴퓨터다. 19.9페타플롭스 처리 능력을 갖췄고 제온 골드 20코어에 엔비디아 테슬라 V100 GPU를 곁들였다.

이쯤 되니 중국이 지난 몇 년 동안 독점하던 순위 상위권에 서밋과 시에라가 등장하면서 다시 미국이 이름을 올리게 됐다. 물론 전체 순위를 보면 미국은 124개, 중국은 206개로 차이가 있다. 이어 일본 36개, 영국 22개, 독일 21개, 프랑스 18개 순이라는 점을 생각해보면 슈퍼컴퓨터 세계에서 벌어지는 미중전은 이미 무역전쟁 저리가라는 수준이다.

이런 치열함 때문인지 TOP500 순위에 들어간 슈퍼컴퓨터가 처리할 수 있는 연산 성능을 모두 합치면 1.22엑사플롭스에 이른다. 처음으로 엑사플롭스를 넘어선 것.

슈퍼컴퓨터 순위 변화를 보면 전체적으로 숫자에선 여전히 중국세가 우위지만 질적인 면에선 5년간 1위를 차지했던 중국을 밀어내고 미국이 상위권에 이름을 올렸다는 점에서 슈퍼컴퓨터를 둘러싼 미중 양국의 대결이 첫 번째 포인트라고 할 수 있다. 다음으론 인공지능이다. 상위권 슈퍼컴퓨터를 보면 알 수 있듯 서밋이나 시에라, 일본 ABCI 같은 슈퍼컴퓨터는 모두 인공지능 처리를 위해 설계를 한 것이다.

이런 이유도 작용했다고 할 수 있다. 다량 데이터 처리가 많은 인공지능 관련 분야에서 GPU의 중요성이 커지고 있는 만큼 슈퍼컴퓨터 성능 경쟁에서도 눈길을 끄는 또 다른 포인트는 GPU의 중요성이 커지고 있다는 것이다.

실제로 상위권에 빠르게 이름을 올린 미국 슈퍼컴퓨터는 모두 GPU에 무게를 둔 설계를 했다고 할 수 있다. 엔비디아의 테슬라가 가장 큰 수혜주라고 할 수 있다. 실제로 TOP500에 새로 추가된 연산 능력 중 절반 이상인 56%가 테슬라 GPU로 인한 것이라고 할 정도다.

서밋을 보자. 여기엔 앞서 밝혔듯 테슬라 V100 6개, GPU 수로 2만 7,648개가 들어가 있다. 전체 연산 성능 중 95%는 GPU가 내는 것이다. 같은 아키텍처를 택한 시에라의 경우에도 테슬라 V100 4개를 썼다는 점에서 다를 뿐이다. 일본 후지쯔가 개발한 ABCI 역시 테슬라 V100 4개인 건 마찬가지다.

앞서 언급했듯 최근 TOP500 순위 변화는 단순히 미중 양국의 순위 쟁탈전 이상의 트렌드, 그러니까 고성능에 인공지능 컴퓨팅에 초점을 맞춘 시스템 전환을 의미하고 있다. 이런 이유로 예전에는 CPU 컴퓨팅 중심이었다면 GPU를 중시하는 구성으로 트렌드가 바뀌고 있다는 걸 보여준다고 할 수 있다는 얘기다. 테슬라 V100이 들어간 서밋과 시에라, ABCI 3개 슈퍼컴퓨터가 처리할 수 있는 딥러닝 연산 성능을 하나로 합치면 TOP500에 들어간 나머지 497개 슈퍼컴퓨터의 딥러닝 연산 성능을 상회한다고 한다. 이런 점에서 슈퍼컴퓨터 순위 변동은 이 시장의 여러 트렌드를 함축적으로 보여주고 있다고 할 수 있겠다.

lswcap

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독