프랑스 AI 스타트업 미스트랄(Mistral)이 텍스트 뿐 아니라 이미지도 처리할 수 있는 자사 첫 멀티모달 모델 픽스트랄 12B(Pixtral 12B)를 발표했다.
픽스트랄 12B는 120억 파라미터의 모델로 텍스트와 이미지를 동시에 처리할 수 있다. 이를 통해 이미지 설명, 객체 식별, 이미지 관련 쿼리에 대한 응답 등 작업이 가능해졌다.
아파치 2.0 라이선스로 공개되어 있다는 점이 특징. 누구나 무료로 입수할 수 있으며 제한 없이 사용하고 수정할 수 있다. 모델은 미스트랄이 공유한 토렌트 마그넷 링크를 사용해 다운로드할 수 있다. 이는 미스트랄이 8x22B MOE를 공개했을 때와 같은 방식이다.
magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%https://t.co/OdtBUsbMKD%3A1337%2Fannounce&tr=udp%3A%2F%https://t.co/2UepcMHjvL%3A1337%2Fannounce&tr=http%3A%2F%https://t.co/NsTRgy7h8S%3A80%2Fannounce
— Mistral AI (@MistralAI) September 11, 2024
이 외에도 깃허브와 허깅페이스 페이지도 공개됐다. 웹에서 기능을 시험해볼 수 있는 데모 버전 등은 공개되지 않았다. 미스트랄 개발자 대응 책임자인 소피아 얀에 따르면 픽스트랄 12B는 곧 미스트랄 챗봇과 API 제공 플랫폼(Le Chat, Le Platforme)에서 테스트할 수 있게 될 예정이라고 한다.
한편 미스트랄이 픽스트랄 12B 개발에 어떤 이미지 데이터를 사용했는지는 불분명하다. AI 모델이 훈련에 사용하는 이미지 데이터에는 저작권으로 보호된 게 포함되어 있을 수 있어 과거에 종종 문제가 됐다. 관련 내용은 이곳에서 확인할 수 있다.