
알리바바 클라우드 AI 연구팀 큐원(Qwen)이 AI 모델 Qwen2.5-Max를 1월 28일 출시했다. Qwen2.5-Max는 여러 테스트에서 GPT-4o와 DeepSeek-V3를 능가하는 점수를 기록했다.
Qwen2.5-Max는 20조 개 이상 학습 데이터를 사용해 사전 훈련한 기본 모델에 지도 학습 미세조정(SFT)과 인간 피드백을 통한 강화학습(RLHF)을 적용해 만든 MoE 모델로 모델 규모를 나타내는 매개변수 수는 1,000억에 달한다.

Qwen2.5-Max의 뛰어난 성능을 보여주는 예시는 먼저 Qwen2.5-Max에 지뢰찾기 웹 앱을 만들어달라는 요청을 상세한 조건과 함께 입력했다. 그 결과 실제로 지뢰찾기를 플레이할 수 있는 코드가 출력됐다.
Qwen2.5-Max, Qwen2.5-72B, DeepSeek-V3, Llama 3.1-405B 각종 벤치마크 결과를 정리한 표에 따르면 Qwen2.5-Max는 모든 테스트에서 가장 높은 점수를 기록했다. Qwen2.5-Max는 여러 테스트에서 GPT-4o와 DeepSeek-V3 성능을 뛰어넘었다.
Qwen2.5-Max는 알리바바 클라우드 API를 통해 사용할 수 있다. 또 큐원이 제공하는 채팅 AI인 큐원챗(Qwen Chat)에서도 Qwen2.5-Max를 이용할 수 있게 됐다. 관련 내용은 이곳에서 확인할 수 있다.