엔비디아가 10월 5∼9일까지 GTC(GPU Technology Conference) 2020 온라인 행사를 열었다. 젠슨황 엔비디아 CEO는 이번 행사가 역대 최대 규모라면서 지난해보다 400개가 더 많은 1,000개 넘는 세션을 진행하는 한편 한국어를 비롯해 중국어, 일본어, 히브리어 세션을 현지 시간에 맞춰서 진행하는 등 온라인 맞춤형으로 진행한다고 밝혔다.
◇ AI 시대의 시작=젠슨황 CEO가 꺼내든 화두는 역시 AI. 그는 모바일 클라우드가 성숙되며 AI 시대가 시작됐다며 AI가 중요한 이유는 컴퓨팅은 자동화 기술이며 소프트웨어 알고리즘이 자동화하기 때문이라고 말했다. 자동화는 자연스레 산업 생산성과 성장으로 이어진다. 농업은 식량 생산을 자동화하고 자동차는 소비비용을 낮춰 삶을 편리하게 만들며 전기와 물 공급을 자동화해 삶의 질을 높인다. 자동화는 대규모 혁신을 이끈다.
그는 자동화할 게 많지만 이런 소프트웨어를 만들 능력이 부족했을 뿐이었다며 하지만 이젠 딥러닝과 빅데이터, 강력한 GPU 연산 능력이 AI 빅뱅을 가져왔다고 설명했다. 젠슨황 CEO는 이젠 소프트웨어가 소프트웨어를 만들 수 있다며 AI는 결국 자동화의 자동화라고 말했다.
그는 이 의미에 대해 AI가 만든 소프트웨어는 사람이 만든 것과는 다르다는 점을 짚었다. 훨씬 더 병렬화되며 수천에서 수백만 배 더 연산 집약적이다. 소프트웨어 개발 방법이 다르고 컴퓨팅 인프라가 다르며 도구나 소프트웨어 실행 방법, 심지어 배포 방법도 다르다. 결국 AI를 위해 컴퓨팅을 재발명해야 하며 프론트엔드와 백엔드 모두에서 교차적으로 작업하는 풀스택을 재검토해야 한다는 것이다.
젠슨황은 엔비디아는 풀스택 컴퓨팅 기업이라며 엔비디아가 만든 플랫폼 SDK로 개발자는 손쉽게 컴퓨팅 파워를 이용할 수 있다고 밝혔다. 그는 이번 GTC 행사에서 SDK 80개를 새로 출시하거나 업데이트해 이제 모두 SDK 수는 110개가 됐다고 말했다. 또 개발자에게는 아키텍처 호환성과 설치 가능한 기기도 많아야 하는데 엔비디아는 10억 개 이상 쿠다 호환 GPU를 출하했다고 강조했다. 쿠다 SDK 다운로드 횟수는 2,000만 번, 올해만 600만 번을 기록했다. 그의 설명을 보면 1,800개 앱이 쿠다로 가속되며 스타트업 6,500개가 엔비디아를 기반으로 삼는다. 젠슨황 CEO는 엔비디아 개발자가 작년에만 60만 명이 가입하는 등 모두 200만 명에 이른다고 설명했다.
◇ 메타버스 시대를 꿈꾸다 ‘엔비디아 옴니버스’=엔비디아 측은 앞으로 20년은 공상과학이나 다를 바 없을 것이라며 메타버스(Metaverse) 시대가 오고 있다고 말한다. 메타버스는 1992년 닐 스티븐슨이 공상과학 소설에서 처음 제시한 것으로 인간 아바타와 소프트웨어 에이전트가 상호 작용하는 3D 공간을 말한다. 인터넷의 뒤를 잇는 가상현실 공간인 것. 이미 마인크래프트나 포트나이트 같은 공간에서 초기 메타버스를 보고 있다고 할 수 있다.
초기 메타버스는 게임처럼 보이지만 게이머는 도시를 건설하고 콘서트와 이벤트를 위해 모이기도 한다. 미래에는 현실과 같을 것이며 이곳에선 인간 아바타와 AI가 같이 지낼 것이라는 것. 이를 위해 엔비디아는 시뮬레이션과 협업을 위한 플랫폼인 옴니버스(Omniverse)를 선보였다. 클라우드 네이티브와 멀티 GPU, 사실적 경로 추적과 재료 시뮬레이션을 통해 언리얼이나 마야, 블렌더, 어도비, 오토데스크 등 여러 세계를 연결할 수 있도록 설계했다.
옴니버스를 이용하면 디자이너와 예술가, 크리에이터, AI도 도구를 이용해 다른 세계를 한 세계로 연결할 수 있다는 것. 옴니버스는 AI 에이전트를 만들고 학습할 수 있는 로봇 시뮬레이터이기도 하다. 모든 게 물리적으로 시뮬레이션으로 로봇이 로봇이 되는 방법을 배울 수 있다. 실제 세상에서 하는 것과 같다는 얘기다. 옴니버스는 현재 오픈 베타 서비스 중이다.
◇ 신약 개발에서 AI 슈퍼컴퓨터까지=질병은 인류에게 여전히 커다란 도전이다. 신약 개발은 어렵다. 평균 개발 기간은 10년 이상이며 평균 R&D 비용은 25억 달러다. 하지만 이 가운데 90%는 실패하며 비용은 9년마다 2배로 증가한다. 1.5조 달러 규모 제약 분야에선 이런 여러 문제로 신약 개발 성공률을 높이기 어렵다. 코로나19가 이런 긴박함을 실감하게 하고 있다.
엔비디아 클라라 디스커버(NVIDIA Clara Discover)는 이런 신약 개발을 위한 첨단 도구 모음이다. 엔비디아 패러브릭스(NVIDIA Parabricks), 클라라 이미징(Clara Imaging), 바이오메가트론(BioMegatron), 바이오버트(BioBERT), 엔비디아 래피드(RAPIDS) 등이며 이를 통해 신약 개발을 더 효과적으로 단축시키겠다는 것이다.
엔비디아는 또 영국에 구축할 케임브리지-1도 소개했다. 400PF AI 성능으로 영국에서 가장 빠르며 전 세계에서 30위 안에 들어가는 슈퍼컴퓨터다. 회사 측은 이런 케임브리지-1을 기반으로 영국 AI와 의료 연구를 위해 학계와 산업계, 스타트업이 협력할 것이라고 설명했다. 엔비디아는 케임브리지-1의 첫 파트너 중 GSK과 파트너십을 통해 전 세계 첫 AI 신약 개발 연구소를 구축한다고 밝혔다.
엔비디아는 의료뿐 아니라 운송과 제조, 물류, 소매 등 모든 주요 산업이 모두 대규모 AI 컴퓨팅 인프라를 갖게 될 것이라고 말했다. 다만 이런 시스템을 만들고 소프트웨어를 개발하고 대규모 슈퍼컴퓨터에서 작동하는 도구를 만드는 게 어렵다며 이를 미리 갖춘 엔비디아 DGX 슈퍼팟(NVIDIA DGX SuperPOD)이라는 AI 슈퍼컴퓨터를 만들었다고 소개했다.
DGX 슈퍼팟은 20∼140개까지 DGX 시스템을 확장할 수 있다. 엔비디아에 따르면 DGX 시스템은 전 세계 상위 TOP20에 드는 슈퍼컴퓨터라고 설명했다.
◇ 엔비디아 맥신 등 AI 대중화 위한 방법=엔비디아는 AI를 대중화하고 있다. 엔비디아는 영상 통화 같은 애플리케이션을 위한 클라우드 기반 스트리밍 영상 AI 플랫폼인 엔비디아 맥신(NVIDIA Maxine)도 발표했다. AI를 통해 얼굴 중요 특징을 인식하고 이런 특징 변화만 전송하고 수신자 측에서 얼굴을 재합성할 수 있다. 이렇게 하면 대역폭을 10배나 줄일 수 있다. AI는 얼굴 각도를 바꿔 통화하는 모든 사람과 눈을 마주치게 하거나 대화 단어를 기반으로 아바타를 사실적으로 애니메이션할 수도 있다. 배경 잡음을 제거하고 해상도를 높여 저조도에서 잘 보이게 하며 배경을 바꾸고 얼굴 조명을 더 밝게 할 수도 있다.
추천은 중요한 AI 모델 중 하나다. 극한 데이터를 처리하는 머신러닝 시스템을 요하기 때문. 엔비디아 멀린(NVIDIA Merlin)은 첫 엔드투엔드 가속 추천 시스템이다. 원하는 만큼 확장할 수 있고 데이터 훈련과 추론까지 연결한다. 데이터를 AWS, GCP, 애저, 아파치 하둡 파일 시스템에서 직접 적재할 수 있다. 멀린은 현재 오픈 베타 중이다.
엔비디아 EGX 엣지 AI 플랫폼은 전 세계 기업이 쉽고 빠르게 첨단 엣지 AI 서버를 구축할 수 있도록 설계되어 있다. 로봇 공장을 제어하고 매장 자동 결제를 처리하고 환자 모니터링 등을 도울 수 있다. EGX는 AI 컴퓨터와 시스템 소프트웨어, AI 프레임워크, 단말기 관리 클라우드 서비스로 이뤄진 풀스택 플랫폼. EGX AI 컴퓨터는 멜라녹스 블루필스 2 DPU, 암페어 GPU 를 PCI 익스프레스 카드 1개로 통합한다. 어떤 표준 OEM 서버도 안전하고 가속화된 AI 데이터센터로 바꿀 수 있게 해준다.
엔비디아 측은 EGX를 이용하면 산업 분야 AI 서비스를 쉽게 생성, 배포, 운영할 수 있다고 밝혔다. 전 세계 산업을 위한 아이폰이 등장한 것과 같다는 비유를 들었다.
엔비디아는 또 젯슨(Jetson) 나노 2GB를 59달러에 발표했다. 젯슨은 로보틱스를 위해 설계한 ARM SoC다. 센서 프로세서와 쿠다 GPU, 텐서 코어가 있다. 엔비디아는 젯슨 나노를 통해 누군지 로봇을 만들 수 있다는 것.
◇ 프로그래밍 가능한 데이터센터 인프라=다음은 데이터센터. 매그넘 IO SDK(Magnum IO SDK)는 멜라녹스(Mellanox) RDMA로 CPU 데이터 이동 부담을 줄이고 멜라녹스 NIC로 네트워킹, 스토리지, 보안 처리를 가속한다. 전용 하드웨어 제품으로 사용하던 걸 이젠 CPU에서 실행되는 소프트웨어 서비스로 처리하는 것. 덕분에 전체 데이터센터가 소프트웨어로 프로그래밍 가능하며 한 서비스로 빠른 제공이 가능하다.
물론 소프트웨어로 정의된 데이터센터는 관리나 확장, 보안에 뛰어나다는 장점이 있지만 소프트웨어로 모든 데이터센터 인프라를 처리하려면 CPU에 큰 부담이 걸린다.
데이터 이동과 보안 처리를 위해 설계된 새로운 프로세스가 필요하며 이를 데이터 프로세싱 유닛 DPU라고 부른다. DPU는 네트워킹과 스토리지, 보안용 가속기로 구성되며 프로그래밍 가능한 ARM CPU로 하이퍼바이저 부하를 줄여준다. DPU는 데이터센터 인프라 처리용 칩이다.
엔비디아가 발표한 블루필드(BlueField) 2 DPU는 단일 칩 데이터센터 인프라. 프로그래밍 가능한 프로세스로 네트워킹과 스토리지, 보안 가속기, 고속 처리 엔진을 담았다. 클라우드 보안 처리를 수행하며 애플리케이션과 인프라간 간극을 메워준다. 암호키를 저장하고 가속하며 SHA-256 인증과 암호화 프로토콜 처리를 수행한다. 또 앱 인식과 침입 방지, 웹 애플리케이션 방화벽, 대역 외 악성 프로그램을 감지한다. 비디오 스트림과 SMPT-2100 브로드캐스트, 5G 네트워크도 대응한다.
DOCA는 엔비디아가 발표한 프로그래밍 가능한 데이터센터 인프라 프로세서 아키텍처다. DOCA SDK를 이용하면 개발자는 소프트웨어 정의 네트워킹과 소프트웨어 정의 스토리지, 사이버 보안, 원격 측정을 위한 인프라 앱을 만들 수 있다. DOCA는 패킷 처리를 위한 P4, 네트워킹을 위한 DPDK, 스토리지를 위한 SPDK, 쿠다와 엔비디아 AI 같은 오픈 API를 기반으로 한다. DOCA용으로 만든 애플리케이션은 블루필드2는 물론 이후에 나올 모든 버전에서 실행할 수 있다.
그 밖에 엔비디아는 VM웨어(VMWare)와의 파트너십을 발표하고 VM웨어를 블루필드에 포팅하고 있다고 밝혔다. 블루필드는 데이터센터 인프라 프로세서, VM웨어는 데이터센터 인프라 OS가 되는 셈이다.
◇ “엔비디아 AI·RTX 엔진, ARM으로 포팅하겠다”=젠슨황 CEO는 행사에서 최근 화제를 모은 ARM 인수 계약에 대해서도 밝혔다. 그는 ARM이 전 세계에서 가장 인기 있는 CPU이며 이제 엔비디아 가속 기술과 AI 컴퓨팅 기술을 ARM 생태계에 제공할 것이라고 말했다.
젠슨황은 ARM 플랫폼 발전을 위해 3개 축으로 투자를 진행하겠다고 밝혔다. 첫째는 ARM 파트너 강화. GPU와 네트워킹, 스토리지 보안 기술 분야다. 이를 통해 완전한 가속 플랫폼을 만들겠다는 것이다.
둘째는 ARM 파트너와 협력해 HPC와 클라우드, 엣지, PC 플랫폼을 만드는 것. 여기에 필요한 건 칩과 시스템, 시스템 소프트웨어다.
셋째는 엔비디아 AI와 엔비디아 RTX 엔진을 ARM으로 포팅하겠다는 것이다. 그는 지금까지 이런 기능은 x86에서만 가능해지만 이 계획에 따라 ARM 플랫폼이 AI 컴퓨팅에서도 선두주자가 될 것이라고 말했다. 관련 내용은 이곳에서 확인할 수 있다.