미스트랄AI, 첫 추론 모델 발표했다

프랑스 AI 기업 미스트랄AI(Mistral AI)가 자사 최초의 추론 모델인 마지스트랄(Magistral)을 발표했다. 마지스트랄은 도메인별 전문 지식, 투명성, 다국어 추론 능력이 뛰어난 것으로 알려져 있으며 인간 사고가 직선적이지 않다는 개념을 바탕으로 논리·통찰·단계적 분석을 결합하며 사고하도록 설계됐다.

미스트랄AI가 개발한 추론 모델인 마지스트랄에는 마지스트랄 미디엄(Magistral Medium)과 마지스트랄 스몰(Magistral Small)이라는 2가지 주요 버전이 존재한다.

보다 고성능의 엔터프라이즈용 버전인 마지스트랄 미디엄은 미스트랄 미디엄(Mistral Medium) 3을 기반으로 하며 기존 추론 모델 학습 데이터를 유용하지 않고 순수한 강화학습(RL)만으로 처음부터 추론 능력을 단련한 점이 큰 특징이다.

그 결과 마지스트랄 미디엄은 수학 벤치마크 AIME 2024에서 73.6%라는 높은 정답률을 달성했으며 다수 답안 중 가장 많은 걸 선택하는 다수결 투표에서는 90%에 달한다.

또 마지스트랄 미디엄은 영어 뿐 아니라 프랑스어, 스페인어, 독일어, 이탈리아어, 러시아어, 아랍어, 일본어, 중국어 등 다양한 언어에서 높은 추론 능력을 유지하며 텍스트 데이터만으로 학습했음에도 이미지를 포함한 문제 해결 능력도 향상됐다. 다만 마지스트랄 미디엄에 대한 구체적인 매개변수 수는 공개되지 않았다.

한편 마지스트랄 스몰은 커뮤니티 개발과 연구를 촉진하기 위해 공개된 오픈소스 버전이다. 매개변수 수는 240억 개이며 아파치 2.0 라이선스 하에 제공된다.

마지스트랄 스몰 개발 접근법은 미디엄과 달리, 먼저 강력한 교사 역할을 하는 마지스트랄 미디엄이 생성한 사고 프로세스를 활용해 지도 파인튜닝(SFT)을 실시하고 그 위에 강화학습을 적용하는 2단계 프로세스를 거쳐 성능이 강화됐다.

마지스트랄 스몰도 AIME 2024에서 70.7%라는 높은 점수를 기록했으며 고성능이면서도 개인용 PC에서도 로컬로 실행할 수 있는 편의성을 갖추고 있다. 모델은 허깅페이스 등 플랫폼에서 자유롭게 다운로드해 자체 배포할 수 있다.

마지스트랄이 갖춘 가장 큰 특징은 투명성으로, 모델이 결론을 내리기 전에 사고 프로세스를 <think> 태그 내에 기록해 구현되며 사용자는 그 추론 과정을 추적·검증할 수 있다.

흥미롭게도 마지스트랄은 텍스트 데이터만으로 훈련되었음에도 이미지 내용을 이해하고 추론하는 멀티모달 능력이 저하되기는커녕 오히려 향상된 것으로 보고됐다.

마지스트랄 미디엄은 미스트랄AI 대화 서비스인 르챗(Le Chat) 프리뷰 버전이나 API를 통해 체험할 수 있으며 주요 클라우드 플랫폼(Amazon SageMaker, IBM WatsonX, Azure AI, Google Cloud Marketplace)에서도 순차적으로 이용 가능해질 예정이다. 마지스트랄 스몰은 오픈소스 모델로서 아파치 2.0 라이선스로 공개되어 있으며 허깅페이스에서 다운로드해 누구나 이용할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.