인텔이 광학 입출력 칩렛(Chiplet)을 CPU에 통합한 OCI(optical compute interconnect) 실증 데모를 발표했다. 구리선과 전기로 데이터를 주고받는 기존 칩보다 훨씬 긴 거리 데이터 전송을 고대역폭과 저전력으로 실현하는 OCI는 대규모 CPU‧GPU 클러스터로 구축된 AI 인프라에 혁명을 가져올 것으로 전망된다.
OCI는 인텔 IPS 그룹이 2024년 3월 OFC 2024 기간 중 발표한 기술입. 핵심은 인텔 CPU에 일체적으로 통합한 완전 통합형 광 입출력 칩렛이다. 기존 전기 입출력은 고대역폭과 저전력으로 데이터를 처리할 수 있지만 1m 이하 초단거리에서만 작동해 대규모화에 제한이 있다. 플러그 가능한 광 트랜시버를 사용하면 거리 문제는 해결되지만 전력 소비와 비용이 증가해 방대한 연산을 수행하는 AI 워크로드에는 적합하지 않다.
이번에 인텔이 발표한 OCI는 최대 100m 광섬유를 통해 각 방향으로 32Gbps 데이터 전송을 64레인 지원하며 고대역폭, 저전력, 장거리 통신을 필요로 하는 AI 인프라 수요에 대응한다. 이를 통해 CPU‧GPU 클러스터 연결 대규모화와 같은 새로운 AI 인프라 설계가 가능해진다.
CPU나 GPU 데이터를 전기로 입출력하는 현행 하드웨어를 광 I/O로 대체하는 것에 대해 인텔은 예를 들면 용량과 이동 범위가 제한된 마차로 물자를 배송하는 걸 훨씬 더 장거리에 훨씬 더 많은 물자를 배송할 수 있는 자동차나 트럭으로 하는 것과 같다며 자사 OCI 칩렛과 같은 광 I/O 솔루션이 AI 스케일링에 가져올 건 이 수준 성능 향상과 에너지 비용 절감이라고 설명했다.
OCI 구현 데모로 인텔은 최대 4Tbps 양방향 데이터 전송이 가능한 완전 통합 OCI 칩렛을 개발했다. 이 데모에서는 OCI가 CPU와 패키징되어 있지만 인텔은 GPU나 AI 칩 IPU, 그 외의 SoC에도 OCI를 통합할 수 있다고 밝혔다.
인텔 측은 서버간 이동이 계속 증가하고 있어 데이터센터 인프라에 대한 부담도 늘어나고 있으며 현행 전기적 입출력 솔루션은 급속히 한계에 도달하고 있다고 밝혔다. 이번 획기적인 성과는 차세대 컴퓨팅 시스템에 포토닉스 상호 연결 솔루션을 원활하게 통합하는 걸 가능하게 하며 또 자사 OCI 칩렛은 대역폭과 도달 범위를 확장하고 전력 소비는 줄여 고성능 AI 인프라에 혁명을 일으킬 만한 ML 워크로드 가속화를 실현해 줄 것이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.