프랑스 AI 스타트업 미스트랄AI(Mistral AI)가 기존 대규모 언어 모델인 미스트랄 라지2(Mistral Large 2)에 문서, 그래프, 이미지 인식 기능을 추가한 멀티모달 AI 모델인 픽스트랄 라지(Pixtral Large)를 출시했다.
이번에 공개된 픽스트랄 라지는 지난 7월 발표된 *미스트랄 라지 2를 기반으로 이미지 이해 기능이 추가된 모델. 이 모델은 1,240억 개 파라미터를 보유하고 있으며 미스트랄 2번째 멀티모달 AI 모델이다. 첫 번째 모델은 픽스트랄 12B였다.
픽스트랄 라지는 Llama-3.2 90B, GPT-4o, 클로드-3.5 소넷, 제미나이-1.5 프로 등과 비교해 멀티모달 AI 벤치마크에서 최고 성능을 기록했다.
픽스트랄 라지는 멀티모달 모델 실제 사용 사례를 반영한 벤치마크 MM-MT-Bench에서 가장 높은 점수를 획득했다.
미스트랄AI는 픽스트랄 라지 출시와 함께 텍스트 모델인 미스트랄 라지도 업그레이드했다. 두 모델 모두 미스트랄 리서치 라이선스(Mistral Research License) 하에 공개됐으며 연구 목적으로는 무료로 사용할 수 있다. 또 픽스트랄 라지는 미스트랄 AI의 채팅 AI(Le Chat)에서도 사용되고 있다. 관련 내용은 이곳에서 확인할 수 있다.
한편 미스트랄 AI는 AI 챗봇 르챗(Le Chat)에 대한 대규모 업데이트를 발표했다. 6가지 주요 개선 사항을 살펴보면 첫째 인용 출처가 포함된 웹 검색 기능. 르챗은 주로 학생이나 전문가가 학습, 연구, 업무에 활용하는 걸 고려해 인터넷 검색 기능을 추가해 모델 트레이닝 지식을 보강했다. 예를 들어 르챗은 헬스케어 시장을 분석하는 데 활용됐다.
둘째 아이디어 개발 및 인라인 편집을 지원하는 캔버스 기능. 캔버스는 대화형 인터페이스와는 별도로 표시되는 공간으로 사용자와 미스트랄 AI 모델 간 결과물을 공유할 수 있는 창의적인 작업 영역이다. 이 기능은 사용자와 AI 간 양방향 대화 없이도 문서를 편집하거나 콘텐츠를 변환하는 작업을 가능하게 한다.
셋째 멀티모달 AI 픽스트랄 라지를 통한 문서 및 이미지 분석. 픽스트랄 라지 성능으로 PDF 파일과 같은 문서 및 이미지를 처리할 수 있게 됐다. 예를 들어 1935년에 발표된 아인슈타인-포돌스키-로젠의 역설 논문을 읽고 정보를 추출하고 요약하는 작업을 수행할 수 있다.
넷째 FLUX1.1 [pro]를 활용한 이미지 생성. 미스트랄 AI는 블랙포레스트랩(Black Forest Labs) 이미지 생성 AI FLUX1.1 [pro]와의 통합으로 고품질 이미지 생성이 가능해졌다. 이 기술은 예술적 또는 창의적 작업에 적합하다.
5번째는 모델에서 결과물까지 통합된 플랫폼 제공. 르챗은 모든 작업이 단일 플랫폼에서 이뤄질 수 있도록 완전히 통합된 환경을 제공한다. 6번째는 추론 편집을 통한 빠른 응답 제공. 르챗은 사용자가 요구하는 작업에 대해 더 빠르고 정확한 응답을 제공할 수 있도록 설계됐다.
현재 르챗 베타 버전은 무료로 공개되어 있다. 미스트랄 AI는 자사는 단순히 AGI(범용 인공지능)를 추구하는 게 아니라 누구나 고급 AI 기능을 활용하여 원하는 대로 사용할 수 있는 도구를 제공하는 걸 목표로 한다고 강조했다. 관련 내용은 이곳에서 확인할 수 있다.