테크레시피

ARM, AI용 차세대 플랫폼‧CPU 코어 발표했다

ARM이 스마트폰‧태블릿용 컴퓨팅 플랫폼으로 ARM CSS 포 클라이언트(Arm Compute Subsystems(CSS) for Client)를 발표하고 Armv9 아키텍처로 설계한 CPU 코어인 코어텍스-X925(Cortex-X925), 코어텍스-A725(Cortex-A725)를 추가한다고 밝혔다.

CSS 포 클라이언트는 2세대 Armv9.2 아키텍처 CPU 코어와 5세대 GPU 코어 등 하드웨어, 안드로이드용 포괄적인 참조 소프트웨어 스택, AI 프레임워크(KleidiAI)와 이미지 처리 라이브러리(KleidiCV, Arm Performance Studio)를 통한 견고한 툴 환경을 통합해 클라이언트 기기 성능과 효율을 최적화하는 종합 플랫폼.

Armv9.2 아키텍처로 설계된 코어텍스-X925는 개발 당시 블랙호크라는 코드명으로 불렸던 CPU 프라임 코어로 2023년 최상위 스마트폰 대비 단일 스레드 성능이 36%, 이전 코어텍스-X4 대비 AI 성능이 46% 향상됐다.

Armv9.2는 IPC 그러니까 명령 당 처리 수를 최대화하도록 개선됐고 이를 통해 코어가 동시에 더 많은 명령을 실행하고 실행 유닛 활용도가 높아져 전체 처리량이 늘어났다. ARM은 넓은 명령 경로를 지원하기 위해 명령 윈도 크기를 2배로 늘려 프로그램 지연을 줄이고 L1 명령 캐시 대역폭과 TLB 크기도 2배로 확장해 명령 가져오기와 디코딩 속도를 높였다.

CPU 고성능 코어인 코어텍스-A725는 코어텍스-A720 대비 성능 효율 35%, 전력 효율 25% 향상됐고 L2 캐시가 1MB로 늘어나 높은 데이터 액세스 애플리케이션 레이턴시가 줄었다.

고효율 코어 코어텍스-A520도 3nm 노드로 업데이트되어 전 세대 대비 전력 효율이 15% 좋아졌다. GPU는 5세대 Immortalis-G925로 14코어, 4MB L2 캐시를 탑재해 그래픽 성능이 37% 높아졌다.

전력 관리 DSU(DynamIQ Shared Unit)에는 성능/효율/저전력 모드가 추가되어 최대 14코어까지 확장 가능해졌고 일반 워크로드 전력 50%, CPU 클러스터 캐시 미스 전력 60% 감소로 배터리 수명이 늘어났다.

ARM에 따르면 CSS 포 클라이언트는 AI에 특화되어 대규모 언어 모델 LLaMA 3, 파이-3 첫 토큰 출력 시간이 각각 42%, 46% 빨라졌고 CPU AI 추론이 59%, GPU AI 추론이 36% 향상됐다. 코어텍스-X925 기반으로 구성하면 이전 대비 CPU AI 추론 성능이 2.7배 빨라졌다고 한다.

ARM은 CSS 포 클라이언트로 AI 사진 배경 흐리기 등 이미지 처리가 24% 빨라져 배터리 수명 손상 없이 부드러운 보케 효과를 즐길 수 있다고 설명하고 있다. 3.6GHz 이상 클록, 3nm 공정 대응이 가능하며 TSMC와 삼성전자 3nm 공정이 주요 옵션이 될 것이라고 한다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사