테크레시피

화웨이, 엔비디아 필적하는 新 AI 아키텍처 출시

미국 제재로 중국 기업의 AI 칩 접근이 제한되는 가운데 화웨이가 엔비디아 GB200 NVL72 연산 능력을 뛰어넘는 AI 인프라 아키텍처인 클라우드매트릭스 384 슈퍼노드(CloudMatrix 384 Supernode)를 발표했다.

클라우드매트릭스 384 슈퍼노드는 자사 AI 칩인 어센드(Ascend) 910C를 384개 탑재하고 있으며 화웨이 사내에서는 엔비디아 NVL72에 필적하는 원자력급 제품(nuclear-level product)으로 위치 지어지고 있다고 한다. 2024년 발표된 NVL72는 GPU 간 고속 통신 기술인 NV링크로 상호 연결된 블랙웰(Blackwell) GPU를 72대 탑재하고 있으며 연산 능력은 180PFLOPS에 달한다.

한편 중국 안후이성 우후시에 있는 화웨이 데이터센터에 배치된 클라우드매트릭스 384는 개별 칩 성능이 블랙웰 3분의 1 정도밖에 되지 않는 단점을 보완하기 위해 5배 이상 어센드 칩이 탑재되어 있으며 총 메모리 용량은 3.6배 이상, 메모리 대역폭은 2.1배에 상당한다. 이로 인해 클라우드매트릭스 384는 NVL72 1.7배인 300PFLOPS 성능을 달성했다.

화웨이는 중국 AI 인프라 스타트업인 실리콘플로(SiliconFlow)와 제휴해 클라우드매트릭스 384에서 중국산 추론 모델인 DeepSeek-R1을 지원할 계획이라고 한다. 보도에선 만일 이 같은 보도가 사실이라면 미국과 중국 간 기술적 긴장이 고조되는 가운데 미국 제재 대상인 화웨이가 컴퓨팅 능력의 자급자족 달성을 향해 착실히 걸음을 내딛고 있음이 부각될 것이라고 말했다.

클라우드매트릭스 384가 지닌 명확한 단점은 전력 소비가 NVL72 3.9배여서 FLOP당 전력 소비는 2.3배, 메모리 대역폭당 전력 소비는 1.8배, 메모리 용량당 전력 소비는 1.1배로 전력 효율이 상당히 열등하다는 점이다.

물론 AI 전력 소비 증가가 큰 문제가 되고 있는 서구와는 달리 석탄화력발전으로 인한 탄소 배출을 신경 쓰지 않는 중국에서는 전력 효율은 큰 문제가 아니다. 게다가 중국은 원자력 발전에서도 세계를 선도하고 있을 뿐 아니라 태양광·수력·풍력 발전에서도 세계 최대 규모를 자랑하고 있어 전력 수요 증가가 중국 기업의 걸림돌이 되지는 않을 것이라는 지적이다.

다만 클라우드매트릭스 384를 구성하는 어센드 910C는 한국산 메모리, 대만산 웨이퍼, 미국·네덜란드·일본산 반도체 제조 장비에 의존하고 있어 결코 중국 국산 칩이라고 할 수 없다. 이들 하드웨어에 대한 높은 해외 의존도는 화웨이에게 과제로 어센드 910C 생산에는 삼성전자 도움이나 TSMC 제재 위반이 불가결했다고 한다.

보도에선 TSMC는 2024년부터 2025년에 걸쳐 80만 개에 이르는 어센드 910B와 어센드 910C 105만 개를 제조하기에 충분한 반도체 다이 290만 개를 중국 기업에 제공하고 있다고 지적했다. HBM이나 웨이퍼 제조 툴, 포토레지스트 등 반도체 제조에 필요한 물자가 효과적으로 관리되지 않으면 어센드 제조를 담당하는 SMIC 생산 능력은 대폭 향상될 가능성이 있다는 지적이다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독

Most popular