테크레시피

마이크로소프트, 엔비디아 호퍼 GPU 48.5만 개 구입했다

마이크로소프트가 2024년 엔비디아 호퍼(Hopper) 아키텍처를 기반으로 한 H100 GPU 구매량에서 경쟁사를 크게 앞선 것으로 나타났다. 이는 오픈AI에 누적 130억 달러를 투자하며 차세대 AI 개발에서 우위를 확보하려는 마이크로소프트의 적극적인 반도체 조달 전략 일환으로 주목받고 있다.

마이크로소프트에 이어 경쟁사를 살펴보면 메타는 22만 4,000개로 마이크로소프트 절반 이하이며 바이트댄스와 텐센트 역시 각각 23만 개, 아마존 19만 6,000개, 구글 16만 9,000개다.

분석기관 옴디아(Omdia)에 따르면 2024년 전 세계 서버 투자 금액은 2,290억 달러에 달할 것으로 예상되며 이 중 43%가 엔비디아 GPU 구매에 사용된다. 마이크로소프트는 오픈AI와 협력해 코파일럿 AI 어시스턴트 및 애저 클라우드 서비스를 강화하기 위해 데이터센터 인프라 확장에 집중하고 있다. 그 중에서도 2024년 GPU 구매량은 2023년 대비 3배 이상 증가했다.

업계에선 독자 AI 칩 개발도 진행 중이다. 메타와 구글은 각각 자체 설계 칩 150만 개를 도입했고 아마존은 독자 칩 트레이니움(Trainium)과 인퍼렌티아(Inferentia)를 130만 개 배치했다. 엔비디아 의존도를 줄이기 위한 이런 움직임 속에서도 마이크로소프트는 자체 AI 가속기 개발에서 다소 뒤처지고 있다.

마이크로소프트는 2023년 11월 자체 AI 칩 마이아(Maia) 100을 발표했으며 2024년부터 데이터센터에 도입되기 시작했지만 현재까지 20만 개만 배치된 상태다. 마이크로소프트 애저 글로벌 인프라스트럭처 시니어 디렉터인 알리스터 스피어즈(Alistair Speirs)는 우수한 데이터센터 인프라는 복잡하며 막대한 자본이 필요하다며 적절한 저장소 구성 요소, 소프트웨어 계층, 호스트 관리 계층, 에러 수정 기능, 그리고 시스템 구축을 위한 기타 모든 요소가 필요하다면서 단순히 최고의 칩을 갖는 것만으로는 충분하지 않다고 밝혔다.

한편 엔비디아 차세대 칩인 블랙웰(Blackwell)에도 과제가 있다. 먼저 블랙웰 칩 발열 문제. 72칩 구성 데이터센터 랙에서 과열 문제가 보고됐고 이로 인해 엔비디아는 공급을 연기했다. 다음으로 GB200 설계 복잡성. 공급망 최적화와 조정이 필요하며 본격적인 출시는 2025년 2~3분기로 연기될 예정이다.

마이크로소프트는 공격적인 GPU 구매 전략으로 AI 개발에서 선도적인 위치를 차지하려 하지만 독자 칩 개발과 같은 장기적인 기술적 자립을 위해 추가적인 노력이 필요한 상황이다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사