테크레시피

엔비디아, 챗RTX에 음성인식‧이미지 검색 추가

엔비디아가 AI 챗봇 챗RTX(ChatRTX)에서 지원하는 대규모 언어 모델(LLM)을 추가하고 이미지 검색 기능을 개선하는 한편 음성 인식 기능을 추가했다고 발표했다.

챗RTX는 엔비디아가 지난 2월 RTX 시리즈 GPU를 활용해 윈도 PC에서 로컬로 작동하는 AI 챗봇으로 발표한 챗위드RTX(Chat with RTX)를 업데이트한 것.

초기에는 LLM으로 미스트랄(Mistral)과 LLaMA 2를 지원했지만 새롭게 Gemma, ChatGLM3, CLIP이 추가됐다. CLIP은 오픈AI가 개발한 이미지 인식 AI로 챗RTX 이미지 검색 능력을 높여 라벨링 없이도 로컬 사진 데이터를 검색할 수 있게 됐다.

또 고성능 음성인식 AI 위스퍼(Whisper)를 통합해 음성 인식이 가능해졌고 프롬프트에 여러 언어로 음성 입력할 수 있게 됐다. 챗RTX는 엔비디아 공식 사이트에서 무료로 받을 수 있다. 다만 파일 크기가 30GB이며 최소 8GB VRAM을 탑재한 RTX 30시리즈 또는 40시리즈 GPU가 필요하다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독