AMD가 캘리포니아 주 샌프란시스코에서 개최된 이벤트(AMD Advancing AI 2024) 기간 중서버용 CPU 에픽(EPYC) 5세대 제품군 에픽 9005 시리즈(코드명: Turin)를 발표했다. 에픽 9005 시리즈는 CPU 아키텍처로 젠(Zen) 5와 젠 5c를 채택했으며 최상위 모델인 에픽 9965는 192개 코어를 탑재해 인텔 경쟁 제품보다 2.7배 빠른 처리가 가능하다고 한다.
에픽 9005 시리즈는 아키텍처로 젠 5 또는 젠 5c를 채택한 서버용 CPU로 3nm 또는 4nm 공정 규칙으로 제조된다. 최상위 모델인 에픽 9965는 192코어·384스레드로, 이전 세대 모델에 비해 사이클당 명령 실행 수(IPC)가 최대 1.7배 증가했다.
EPYC 9965는 인텔 제온 플래티넘 8592+에 비해 2.7배 빠르게 일반적인 처리를 실행할 수 있다. 데이터베이스 처리 속도는 3.9배, 비디오 트랜스코딩 처리 속도는 4배다. 또 HPC 분야에서는 최대 3.9배 처리 성능을 발휘한다. AI 추론 처리 성능은 최대 3.8배다.
에픽 9005 시리즈는 높은 처리 성능을 갖추면서도 부피와 전력 소비를 줄인 게 특징으로 경쟁 제품과 동일한 성능을 목표로 할 경우 서버 대수를 87% 줄이고 전력 소비를 68% 줄일 수 있다. 관련 내용은 이곳에서 확인할 수 있다.
AMD는 또 CDNA 3 아키텍처를 기반으로 하는 AI 가속기 인스팅트(Instinct) MI300 시리즈 강화 모델인 인스팅트 MI325X를 2024년 4분기 대량 출하할 것이라고 공식 발표했다. 동시에 CDNA 4 아키텍처를 채용한 차세대 모델 인스팅트 MI355X를 2025년 후반 출하할 예정이라고도 밝혔다.
인스팅트 MI325 존재는 지난 7월 개최된 2024년 2분기 실적 보고에서 발표됐다. MI300X에서 MI325X로의 주요 변경 사항은 GPU당 메모리 용량으로 MI300X에서는 최대 192GB였던 것이 최대 256GB로 증가했다. 다만 실적 보고에서는 최대 288GB로 보고됐기 때문에 공식 발표에서 메모리 용량이 조금 줄어든 것이다. 메모리 통신 대역폭은 6TB/s이며 트랜지스터 수는 1,530억 개다. 처리 능력은 8비트 부동소수점 연산에서 2.6PFLOPS, 16비트 부동소수점 연산에서 1.3PFLOPS다.
MI325를 8개 조합한 플랫폼의 경우 처리 능력은 FP8 연산에서 20.8PFLOPS, FP16 연산에서 10.4PFLOPS라고 한다.
AMD는 MI325X와 엔비디아 H200을 대규모 언어 모델을 작동시켰을 때의 단일 GPU 성능 비교 결과를 보여줬다. 믹스트랄 8x7B, 믹스트랄 7B, Llama 3.1 70B 모두에서 MI325 성능이 H200을 능가했다고 한다.
또 MI325X와 H200을 각각 8개씩 조합해 Llama 3.1 405GB 모델과 70GB 모델을 작동시켰을 때의 멀티 GPU 성능 비교 결과가 제시됐다. MI325 플랫폼은 H200 HGX 1.4배 성능을 보였다고 한다.
AMD는 메타 Llama-2를 트레이닝할 때 MI325X 성능은 단일 및 멀티 모두 H200과 거의 동등하다고 주장하고 있다.
또 AMD는 인스팅트 MI300 시리즈 상위 모델로 인스팅트 MI350 시리즈를 출시한다고 발표했다. CDNA 4 아키텍처를 채용하고 최대 메모리 용량은 288GB다.
인스팅트 MI350 시리즈 중 하나인 MI355X는 FP16 연산과 FP8 연산 모두에서 MI325보다 1.8배 성능을 발휘한다고 한다. 또 인스팅트 MI350 시리즈에서는 FP6 및 FP4 데이터 타입도 지원되며 MI355X는 9.2PFLOPS 연산 능력을 보여준다고 한다.
AMD에 따르면 MI355X는 2025년 후반 출하 예정이라고 한다. 또 그 다음 세대 아키텍처를 채용한 인스팅트 MI400 시리즈는 2026년 대량 출하를 목표로 하고 있다고 AMD는 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.
AMD는 또 지연 시간을 줄이면서 정확도와 처리량을 향상시킨 아키텍처 젠 5를 채용하고 이전 모델보다 더욱 세련된 55TOPS를 구현하는 프로세서 시리즈인 라이젠(Ryzen) AI PRO 300을 발표했다.
라이젠 AI 300가 지원하는 AI 처리 성능은 50TOPS였지만 라이젠 AI 프로 300 최상위 모델인 AMD 라이젠 AI 9 HX 프로 375는 55TOPS로 향상됐다. AMD에 따르면 라이젠 AI 프로 300 시리즈는 3세대 상용 AI 모바일 프로세서에 해당하며 전화 회의에서의 자동 자막 생성과 언어 번역, 고급 AI 이미지 생성 등에서 성능을 발휘하도록 설계됐으며 마이크로소프트 AI PC군인 코파일럿+ 요구 사항에도 부합한다고 한다. 엔터프라이즈용 코파일럿+ 프로세서로는 세계 최고 라인업이라는 설명이다.
최상위 모델인 라이젠 AI 9 HX 프로 375는 인텔 코어 울트라 7 165U와 비교해 최대 40% 높은 성능, 최대 14% 빠른 생산성 성능을 제공한다고 한다. AMD가 게시한 2종류 벤치마크에서는 모두 라이젠 AI 9 HX 프로 375가 40% 이상 빠르다고 나타났다.
제조는 4nm 공정으로 이뤄지며 아키텍처로는 젠 5를 채용했다. 또 AI용 XDNA 2 아키텍처를 통합해 50TOPS 이상 AI 처리 능력을 실현했다.
한편 라이젠 AI 프로 300 시리즈를 탑재한 OEM 시스템은 2024년 후반부터 매장에 진열될 예정. 발표에 맞춰 마이크로소프트와 HP, 레노버가 성명을 발표한 것으로 봐서 적어도 이 3개 기업에서는 탑재 제품이 출시될 것으로 보인다. 관련 내용은 이곳에서 확인할 수 있다.
한편 인텔은 10월 10일 데스크톱 AI PC용 새로운 프로세서 코어 울트라 200S(Core Ultra 200S. 코드명 : Arrow Lake-S) 시리즈를 발표했다. 이전 14세대 칩과 비교해 저온에서 효율적으로 작동하며 AI 작업을 가속화하기 위한 NPU도 탑재되어 있다.
코어 울트라 200S 시리즈는 차세대 P코어(Performance-cores)를 최대 8개, 차세대 E코어(Efficient-cores)를 최대 16개 탑재하고 있으며 멀티스레드 워크로드에서 이전 세대 제품보다 최대 14% 성능 향상을 실현했다고 한다. 또 상급자용으로는 처음으로 NPU를 탑재한 데스크톱 PC용 프로세서이기도 하다.
코어 울트라 200S 시리즈에는 다음 5개 모델이 라인업되어 있다. 24코어(P코어 8개·E코어 16개)인 코어 울트라 9 285K는 589달러, 20코어(P코어 8개·E코어 12개)인 코어 울트라 7 265K는 394달러, 20코어(P코어 8개·E코어 12개)로 GPU 코어를 미탑재한 코어 울트라 7 265KF는 379달러, 14코어(P코어 6개·E코어 8개)인 코어 울트라 5 245K 309달러, 14코어(P코어 6개·E코어 8개)로 GPU 코어 미탑재 코어 울트라 5 245KF 294달러다.
GPU를 따로 탑재할 경우 GPU 코어 미탑재 KF 버전을 선택해 비용을 절약할 수 있다. 현재 시점에서는 코어 울트라 9 285K GPU 미탑재 버전인 코어 울트라 9 285KF는 발표되지 않았지만 인텔은 향후 옵션으로 등장할 가능성이 있다고 언급했다.
코어 울트라 200S 시리즈는 이전 모델과 비교해 전력 소비가 크게 줄었다. 13세대와 14세대 인텔 코어 CPU는 경쟁사인 AMD 동급 제품에 비해 훨씬 많은 전력을 소비했지만 새로운 코어 울트라 200S 시리즈에서는 일상 애플리케이션 사용 기준으로 전력 소비를 최대 58% 줄이고 게임에서 시스템 전력 소비도 최대 165W 줄였다고 인텔은 강조하고 있다.
또 싱글 스레드 성능은 이전 세대 제품과 비교해 최대 6%, 멀티 스레드 성능은 최대 14% 향상됐으며 주요 경쟁 프로세서와 비교해 AI 지원 크리에이터용 애플리케이션에서 최대 50% 성능 향상을 실현했다고 한다. 인텔은 새로운 NPU는 AI 처리를 오프로드할 수 있게 된다면서 예를 들어 디스크리트 GPU 부담을 줄여 게임 프레임률을 향상시키거나 AI 워크로드에서의 전력 사용량을 크게 줄이거나 게임에서의 얼굴과 제스처 트래킹 등 접근성 사용 사례를 게임플레이 성능에 미치는 영향을 최소화하면서 실현한다고 설명했다.
인텔은 발표 기자 회견에서 14세대 프로세서 코어 i9-14900K와 코어 울트라 9 285K로 어쌔신 크리드 미라주를 시연하며 코어 울트라 9 285K가 80W 적은 전력으로 동등한 성능을 발휘한다는 걸 보여줬다. 코어 울트라 9 285K는 콜 오브 듀티 모던 워페어 III 같은 게임에서도 최대 58W 전력을 절감하며 워해머: 스페이스 마린 2 같이 전력 소비가 165W나 적어지는 경우도 있다고 한다.
코어 울트라 200S 시리즈는 전력 소비 면에서 뛰어난 반면 게임 성능에 관해서는 AMD 라이젠 9 9950X나 라이젠 9 7950X3D에 필적하거나 일부 게임에서 뒤처지며 라이젠 7 7800X3D에는 명확히 열세라고 한다. 인텔 클라이언트 컴퓨팅 그룹 담당 부사장인 로버트 할록은 AMD X3D 시리즈와 비교하면 5% 정도 뒤처진다고 생각한다면서도 CPU에 내장된 캐시와 뛰어난 IPC를 고려하면 코어 울트라 200S 시리즈는 좋은 제품이라고 말했다.
코어 울트라 200S 시리즈는 10월 25일부터 온라인 쇼핑몰, 매장, 제조업체를 통해 판매 예정이다. 관련 내용은 이곳에서 확인할 수 있다.