엔비디아가 4월 13일 개최한 온라인 기술 콘퍼런스인 GTC 2021 기간 중 1,000TOPS 성능을 제공하는 자율주행 차량을 위한 차세대 AI 대응 SoC인 드라이브 아틀란(DRIVE Atlan)을 발표했다. 드라이브 아틀란은 현재 실용화된 자율주행 차량용 SoC보다 33배 연산 능력을 갖추고 있으며 엔비디아는 2025년 실용화를 목표로 하고 있다.
드라이브 아틀란은 자율주행 차량 전용으로 특화한 SoC로 엔비디아 차세대 GPU 아키텍처, ARM 기반 CPU 코어, 딥러닝과 컴퓨터비전 가속기 외에 자율주행 차량 자율 주행에 요구되는 복잡한 컴퓨팅과 AI 워크로드를 지원하는 DPU인 블루필드(BlueField)를 엔비디아 SoC로는 처음 탑재하고 있다.
드라이브 아틀란 연산 능력은 현재 양산 자동차와 트럭에 탑재한 드라이브 AGX 자비에르(DRIVE AGX Xavier) 30TOPS, 드라이브 AGX 오린(DRIVE AGX Orin) 254TOPS에 비해 1,000TOPS에 달한다. 엔비디아는 드라이브 아틀란을 소프트웨어드 파인드 차량을 구축하기 위해 컴퓨팅 기능을 제공하는 차량 내 데이터센터라고 표현하고 있다.
하지만 드라이브 아틀란은 아직 개발 중이며 2025년 모델부터 탑재를 목표로 하고 있다. 드라이브 아틀란은 하드웨어는 처음부터 설계한 것이지만 드라이브 AGX 자비에르와 드라이브 AGX 오린과 마찬가지로 쿠다 환경과 텐서RT(TensorRT) API와 라이브러리를 통해 개발이 가능하기 때문에 지금까지 해온 기술 투자를 그대로 활용할 수 있다고 한다.
또 엔비디아는 드라이브 AGX 왼과 외부 카메라 12개, 내부 카메라 3개, 레이더 9개, 라이더 센서 1개를 조합해 레벨4 자율 주행을 실현하는 8세대 자율주행 플랫폼 하이퍼리온(Hyperion)도 발표했다.
8세대 하이퍼리온은 자율주행을 위한 주변 모니터링 외에도 차량 속도 표시와 에어컨 등 UI, 음악이나 영상을 흘리는 멀티미디어 기능, 차량 내에 있는 사람 얼굴 인식 등을 모두 드라니브 AGX 오린 제어 시스템으로 처리한다. 엔비디아에 따르면 8세대 하이퍼리온은 2021년 하반기 출시 예정이며 기조 연설에선 2020년 6월 엔비디아와 파트너십을 맺은 메르세데스벤츠 콘셉트카 CG 모델이 프레젠테이션에 사용되기도 했다.
엔비디아는 또 스웨덴 자동차 제조사인 볼보와 협력을 확대하고 미래 볼보자동차에 드라이브 AGX 오린을 탑재한다고 발표했다. 먼저 드라이브 AGX 오린이 탑재되는 건 2022년 발표 예정인 XC9이며 볼보 자회사인 젠스엑트(Zenseact)가 개발한 소프트웽어와 스티어링, 브레이크 백업 시스템과 결합해 특정 조건 하에서 완전 자율 주행이 가능한 레벨4 자율 주행을 실현한다는 것이다.
젠슨 황 엔비디아 CEO는 운송 산업은 몇십 년 동안 의지할 수 있는 컴퓨팅 플랫폼을 필요로 하고 있다면서 소프트웨어에 대한 투자는 거액이 들어가며 차량 1대단 투자를 반복하는 건 불가능한 상황이라고 지적했다. 이어 엔비디아 드라이브가 첨단 AI와 AV 컴퓨팅 플랫폼으로 포괄적인 소프트웨어와 개발자 생태계로 여러 세대 아키텍처 호환성을 유지할 수 있다고 설명했다. 그는 자사 로드맵은 진정한 의미에서 엄청난 기술이며 엔비디아의 강점인 AI와 자동차, 로봇, 안전성과 블루필드에 의한 안전한 데이터센터 모두를 융합해 안전하고 자율적인 차량을 만들어낼 수 있을 것이라고 강조했다. 관련 내용은 이곳에서 확인할 수 있다.
한편 엔비디아는 대화형 AI 구축이 가능해진 소프트웨어 프레임워크인 자비스(Jarvis) 제공을 시작했다고 발표했다. 자비스는 방대한 데이터에 의해 훈련되며 개발자는 고정밀 자동 음성 인식과 언어 이해 능력을 갖춘 대화형 AI 에이전트 개발이 가능해질 것이라는 설명이다.
자비스는 지금까지 실현될 수 없던 새로운 언어 기반 앱을 실행하고 24시간 환자를 모니터링해 의료종사자 부담을 완화하고 디지털 간호사와 국경을 초월한 협력, 모국어로 라이브 콘텐츠 시청을 가능하게 해주는 실시간 번역 등 다양한 서비스 가능성이 열려 있다.
자비스는 다른 언어와 발음, 환경, 전문 용어로 이뤄진 10억 페이지 이상 텍스트와 6만 시간 분량 음성 데이터에 의해 훈련된 모델로 구축되어 있다. 또 GPU 가속을 활용해 엔드투엔드 오디오 파이프라인을 100밀리초 미만으로 실행하고 듣기와 이해, 응답 생성을 고속으로 처리한다. 음성 파이프라인은 클라우드와 데이터센터에 배포된 사용자 수백만 명에게 곧바로 대응할 수 있다.
개발자는 TAO라는 프레임워크를 이용해 교육과 적응, 최적화해 모든 작업을 모델에 쉽게 대응할 수 있고 해당 과정을 통해 AI 고도 전문 지식이 필요 없게 된다. 젠슨황 엔비디아 CEO는 음성 인식과 언어 이해, 음성 합성 등 획기적 딥러닝을 통해 뛰어난 클라우드 서비스가 만들어지고 있지만 자비스는 이런 첨단 대화형 AI를 클라우드 이외에서도 이용할 수 있도록 사용자가 모든 곳에서 AI 서비스를 제공할 수 있도록 하겠다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.
엔비디아는 이번 행사 중 사이버 공격을 실시간 탐지하고 보호하기 위한 오픈 AI 프레임워크인 모르페우스(Morpheus)도 발표했다. 모르페우스는 클라우드에 최적화된 사이버 보안 프레임워크. AI를 이용해 암호화되지 않은 데이터 유출과 피싱 시도, 악성코드 침해 프로필, 서버 오류나 고장 등 위협이나 이상을 특정해 분류, 보호한다. 모르페우스는 사전 훈련한 AI 모델도 준비되어 있지만 개발자는 AI를 활용해 자신의 모델을 통합할 수 있다.
엔비디아는 데이터센터를 위한 칩인 블루투스 DPU(data processing unit)를 모르펭우스와 함께 이용하면 데이터센터 네트워크 내에서 모든 연산 노드가 위협을 감지하는 사이버 방어 센서 역할을 한다고 설명한다. 따라서 조직은 데이터를 복제하지 않고 모든 패킷을 빠르게 분석할 수 있게 사용자가 데이터센터 코어에서 엣지까지 보호할 수 있다고 말한다.
엔비디아는 기존 AI 보안 도구는 보통 네트워크 트래픽 데이터 중 5% 정도를 샘플링해 조사하는 불완전한 모델을 기반으로 한 위협 탐지 알고리즘이라고 지적했다. 이어 모르페우스라면 모든 패킷을 분석할 수 있다고 강조했다. 모르페우스는 비용과 성능을 희생하지 않고도 기존 사이버 보안 프레임워크보다 많은 데이터를 분석할 수 있다는 것.
젠슨 황 CEO는 제로 트러스트 보안 모델은 데이터센터 내 모든 트랜젝션을 실시간으로 모니터링할 필요가 있다면서 서버 침입이나 위협을 곧바로 감지하고 최신 데이터센터 데이터를 운용할 필요가 있기 때문에 이는 중요한 기술적 과제라고 강조했다.
현재 주요 하드웨어나 소프트웨어 사이버 보안 솔루션 제공 업체가 엔비디아와 협력하고 있으며 데이터센터 보안 제품을 최적화하고 모르페우스 프레임워크와 통합을 실시하고 있다고 한다. 협력 업체는 아리아사이버시큐리티솔루션즈(ARIA Cybersecurity Solutions), 클라우드플레어(Cloudflare), F5, 포티넷(Fortinet), 가디코어(Guardicore), 캐노니컬(Canonical), 레드햇, VM웨어 등이다. 관련 내용은 이곳에서 확인할 수 있다.
엔비디아는 그 밖에도 차세대 노트북과 데스크톱, 서버용 암페어(Ampere) 아키텍처 기반 GPU도 이번 행사 기간 중 발표했다.
이번에 발표한 GPU는 데스크톱용 엠비디아 RTX A5000, A4000. 노트북용으로는 RTX A5000 랩톱 GPU, A4000, A3000, A2000. 데이터센터용은 엔비디아 A16 GPU와 엔비디아 A10 GPU 등 모두 8종이다.
이들 제품은 모두 암페어 아키텍처를 탑재하고 있으며 이전 세대 대비 최대 2배 처리량을 제공해 레이트레이싱, 음영, 노이즈 제거 작업을 동시에 실행할 수 있는 2세대 RT 코어나 이전 세대보다 2배 처리량에 최대 10배 희소성을 실현하는 TF32·BFloat16 데이터 형식을 지원하는 3세대 텐서 코어, 이전 세대보다 FP32 처리량 2.5배, 그래픽과 컴퓨팅 워크로드를 대폭 끌어올린 쿠다 코어를 제공한다.
데스크톱용 GPU의 경우 RTX A5000은 24GB, A4000은 16GB GDDR6 메모리를 기본 탑재하고 있으며 A5000은 엔비디아 NV링크를 2개 연결해 메모리를 48GB로 이용할 수 있고 A5000은 여러 고성능 가상 워크스테이션 인스턴스를 실행할 수 있는 엔비디아 RTX vWS 소프트웨어를 지원하며 원격 사용자도 고급 디자인과 AI 컴퓨팅 등 워크로드를 실행할 수 있다. PCIe는 4세대로 이전 세대보다 2배 대역폭을 제공한다.
노트북용은 효율화를 달성한 3세대 맥스큐(Max-Q) 기술을 탑재해 GPU 메모리는 최대 16GB다. RTX A5000 랩톱 GPU는 쿠다 코어 6,144개, 텐서 코어 192개, RT코어 48개, 소비 전력은 80∼165W다. A4000은 쿠다 코어 5,120개, 텐서 코어 160개, RT코어 40개를 갖췄다. A3000은 쿠다 코어 4,095개, 텐서 코어 128개, RT코어 32개를, A2000은 쿠다 코어 2,560개와 텐서 코어 80개, RT코어 20개를 곁들였다. 소비전력은 35∼95W다.
또 노트북용으로 이전 세대인 튜링 아키텍처를 기반으로 한 엔비디아 T1200 랩톱 GPU와 엔비디아 T600도 선보였다. 이들 2종은 다중 애플리케이션을 사용하는 전문가 작업을 위해 설계했다.
데이터센터용은 설계자와 엔지니어에 특화한 것으로 A16은 이전 세대보다 총 비용은 줄었지만 최대 2배 사용자 밀도를 달성한 가상 데스크톱 인프라 환경을 실현한다. A10은 이전 세대보다 최대 2.5배 가상 워크스테이션 성능을 제공한다. 이런 A16과 A10은 엔비디아 RTX 가상 워크스테이션과 엔비디아 가상 PC 소프트웨어를 결합해 성능과 메모리 속도를 향상시켰고 그래픽과 AI, VDI 등 모든 워크플로우를 간소화하기 위해 사용자는 효율적이고 생산적인 일에 많은 시간을 할애할 수 있다는 설명이다.