테크레시피

엔비디아 “브라우저에서 AI 슈퍼컴퓨팅 액세스를…”

엔비디아가 3월 21∼24일 개최한 자체 기술 콘퍼런스인 엔비디아 GTC 2023(NVIDIA GTC 2023) 기간 중 이미지 생성 AI와 대화형 AI 등 소위 제너레이티브 AI를 비롯해 애플리케이션 고급 모델을 학습시키기 위한 소프트웨어에 기업이 곧바로 접근할 수 있도록 해주는 AI 슈퍼컴퓨팅 서비스인 엔비디아 DGX 클라우드(NVIDIA DGX Cloud)도 발표했다.

오라클과 제휴해 제공하는 DGX 클라우드는 엔비디아 AI 소프트웨어와 결합한 엔비디아 DGX AI 슈퍼컴퓨팅 전용 클러스터를 제공한다. 모든 기업은 간단하게 웹브라우저에서 AI 학습과 개발을 수행하는 슈퍼컴퓨터에 액세스할 수 있게 되어 인프라 정비나 관리 복잡성을 제거할 수 있다는 것. DGX 클라우드는 월 3만 6,999달러에 월 단위 대여로 사용할 수 있다.

젠슨황 CEO는 스타트업은 혁신적 제품과 비즈니스 모델을 구축하기 위해 경쟁하고 있으며 기존 기업은 이에 대응하려 한다며 DGX 클라우드를 통해 고객은 글로벌 규모 클라우드에서 엔비디아 AI 슈퍼컴퓨팅에 곧바로 접근할 수 있게 된다고 밝혔다.

그는 챗GPT 같은 AI 업계 성장에 대해 초대 아이폰이 발표됐을 때와 같은 터닝 포인트(The iPhone Moment)라고 표현하며 중요한 국면에 있다고 강조했다. 그는 뛰어난 AI 기능은 기업이 자사 제품과 비즈니스 모델을 재고할 필요성을 느끼게 하고 있다고 밝혔다.

DGX 클라우드는 60GB VRAM이 장착된 엔비디아 H100 또는 엔비디아 A100 8개로 이뤄져 있으며 노드 전체에서 메모리 총량은 640GB다. DGX 클라우드에는 엔비디아 AI 플랫폼 소프트웨어 레이어인 엔비디아 AI 엔터프라이즈가 포함되어 있어 엔드투엔드 AI 프레임워크와 사전 학습된 모델을 제공, 데이터사이언스 파이프라인을 가속화할 수 있다. DGX 클라우드는 프로덕션 AI 개발과 배포를 간소화해준다는 것이다. 개발자는 새로운 사전 학습 모델과 최적화된 데이터사이언스 소프트웨어 라이브러리를 사용해 AI 프로젝트를 곧바로 시작할 수 있다.

엔비디아는 앞으로 주요 클라우드 서비스 제공업체와 제휴해 DGX 클라우드 인프라를 호스팅할 예정이다. 올초 마이크로소프트 애저에서 DGX 클라우드 호스트를 개시할 예정이며 구글 클라우드에도 곧 확대할 방침이다. 또 세계적인 바이오테크놀러지 기업인 암젠(Amgen), 보험 기술 기업인 CCC인텔리전트솔루션즈(CCC Intelligent Solutions), 디지털 비즈니스 플랫폼 제공업체인 서비스나우(ServiceNow)가 DGX 클라우드를 사용하게 된다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

엔비디아는 또 이 행사에서 모바일 워크스테이션용 GPU(RTX 5000 Ada Generation, RTX 4000 Ada Generation, RTX 3500 Ada Generation, RTX 3000 Ada Generation, RTX 2000 Ada Generation), 데스크톱 워크스테이션용 GPU(RTX 4000 Small Form Factor(SFF) Ada Generation)를 발표했다.

젠슨황 엔비디아 CEO는 GPU는 이제 고도 협업을 위한 콘텐츠 제작, 디자인, AI 워크플로에 필요한 성능을 제공한다고 강조하며 이번에 발표한 제품이 획기적인 성능과 이전 세대보다 최대 2배 효율을 제공한다고 강조했다. 모바일 워크스테이션용 GPU 5개 모델 코어 구성은 노트북용 GPU인 지포스 RTX 40 시리즈 랩톱과 거의 비슷하다. 엔비디아에 따르면 RT 코어는 3세대, 텐서 코어는 4세대가 되어 성능은 이전 세대보다 최대 2배 높아졌다는 것. 엔비디아 RTX 에이다 제너레이션 시리즈를 탑재한 모바일 워크스테이션은 3월 중 출시될 전망이다.

데스크톱 워크스테이션용 GPU 2개 모델은 에이다 러브레이스(Ada Lovelace) 아키텍처를 채택하고 있으며 지난 1월 출시된 RTX 6000 에이다 제너레이션에 이어 RTX 4000 SFF 에이다 제너레이션은 2번째 모델에 해당한다. RTX 4000 SFF 에이다 제너레이션은 TDP가 70W로 300W인 RTX 6000 에이다 제너레이션보다 소비 전력이 낮고 판매 가격 역시 20% 수준으로 억제해 하이엔드 GPU를 필요로 하지 않는 사용자를 위한 모델이라고 할 수 있다. 엔비디아는 RTX 4000 SFF 에이다 제너레이션을 탑재한 데스크톱 워크스테이션을 3월부터 HP와 레노버, 복스 등이 선보일 것이라고 밝혔다.

엔비디아는 또 TSMC, ASML, 시놉시스와 공동으로 반도체 제조용 소프트웨어 라이브러리 cuLitho를 개발하고 있다고 밝혔다. cuLitho는 AI를 활용한 기술로 실리콘 웨이퍼에 회로 패턴을 새기는 리소그래피로 최대 40배 성능 향상을 실현하고 전력 효율은 9배 향상한다고 한다. 젠슨황 CEO는 칩 산업은 전 세계 거의 모든 산업 기반이 되고 있다면서 cuLitho에 의해 반도체 팹은 2nm 이후 칩 제조 효율을 높이고 이산화탄소 배출량을 삭감하게 될 것이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독