아마존, AWS서 사용 가능한 멀티모달 생성 AI 모델 발표

아마존 클라우드 컴퓨팅 부문인 AWS(Amazon Web Services)는 12월 2일부터 라스베이거스에서 개최되는 이벤트인 리인벤트 2024(re:Invent 2024) 기간 중 자체 멀티모달 생성 AI 모델인 아마존 노바(Amazon Nova)를 발표했다. 아마존 노바는 여러 모델로 구성되어 있으며 그 중 3개 모델은 12월 3일부터 AWS 고객에게 제공된다.

AWS는 아마존 노바를 사용하면 거의 모든 생성 AI 작업 비용과 대기 시간을 줄일 수 있다. 아마존 노바를 기반으로 엔터프라이즈 워크로드에 최적화된 다양한 인텔리전스 클래스로 복잡한 문서와 비디오 분석, 차트와 다이어그램 이해, 매력적인 비디오 콘텐츠 생성, 정교한 AI 에이전트 구축이 가능하다고 말했다.

아마존 노바는 이해(Understanding) 모델과 크리에이티브 콘텐츠 모델 2가지 유형으로 AWS 생성 AI 서비스인 아마존 베드록(Amazon BedRock)을 통해 제공될 예정이다.

이해 모델은 4개다. 먼저 아마존 노바 마이크로(Amazon Nova Micro). 텍스트만 처리하는 저비용, 저대기 시간 모델로 12만 8000 토큰 컨텍스트 길이를 가지며 텍스트 요약, 번역, 콘텐츠 분류, 채팅, 간단한 수학적 추론과 코딩을 효율적으로 수행할 수 있다. 다음으로 아마존 노바 라이트(Amazon Nova Lite). 초고속으로 이미지, 비디오, 텍스트 입력을 처리하는 저비용 멀티모달 모델로, 30만 토큰까지의 입력을 처리할 수 있다. 3번째는 아마존 노바 프로(Amazon Nova Pro). 정확성, 속도, 비용의 최적 균형을 실현한 고성능 멀티모달 모델이다. 마지막으로 아마존 노바 프리미어(Amazon Nova Premier)는 복잡한 추론 작업에 대응해 사용자 정의 모델을 추출하기 위한 교사 모델로 사용될 최상위 모델이다.

크리에이티브 콘텐츠 모델은 2개로 아마존 노바 캔바스((Amazon Nova Canvas). 스튜디오 품질 이미지를 생성할 수 있는 이미지 생성 모델이다. 이어 아마존 노바 릴(Amazon Nova Reel)은 텍스트 프롬프트와 이미지에서 단편 동영상을 생성할 수 있는 비디오 생성 모델이다.

AWS에 따르면 아마존 노바 모든 모델에는 안전성과 콘텐츠 조정 기능이 내장되어 있으며 특히 크리에이티브 콘텐츠 모델에는 워터마크 기능이 포함되어 있다.

아마존 노바 모델 대부분은 12월 3일부터 사용 가능하며 아마존 노바 프리미어는 2025년 1분기에 출시될 예정이다. 주로 AWS 미국 동부(버지니아 북부) 리전에서 사용 가능하며 가격은 사용량에 따른 종량제 모델을 채택하고 있다.

아마존은 2025년을 위해 2가지 추가 모델을 도입할 계획을 발표했다. 첫 번째는 음성 대 음성 모델로 음성 입력을 자연어로 이해하고 더 자연스러운 대화를 실현하는 것을 목표로 한다. 2번째는 네이티브 멀티모달 대 멀티모달 모델. 다양한 형식 데이터를 입력과 출력 모두에서 처리할 수 있는 모델이다.

AWS는 이런 개발이 이제 시작에 불과하다며 향후 고객에게 실제 가치를 제공하기 위한 혁신을 계속해 나갈 것임을 강조했다. 관련 내용은 이곳에서 확인할 수 있다.