中 알리바바, GPT-4o보다 뛰어난 AI 모델 내놨다

알리바바 클라우드 AI 연구팀 큐원(Qwen)이 AI 모델 Qwen2.5-Max를 1월 28일 출시했다. Qwen2.5-Max는 여러 테스트에서 GPT-4o와 DeepSeek-V3를 능가하는 점수를 기록했다.

Qwen2.5-Max는 20조 개 이상 학습 데이터를 사용해 사전 훈련한 기본 모델에 지도 학습 미세조정(SFT)과 인간 피드백을 통한 강화학습(RLHF)을 적용해 만든 MoE 모델로 모델 규모를 나타내는 매개변수 수는 1,000억에 달한다.

Qwen2.5-Max의 뛰어난 성능을 보여주는 예시는 먼저 Qwen2.5-Max에 지뢰찾기 웹 앱을 만들어달라는 요청을 상세한 조건과 함께 입력했다. 그 결과 실제로 지뢰찾기를 플레이할 수 있는 코드가 출력됐다.

Qwen2.5-Max, Qwen2.5-72B, DeepSeek-V3, Llama 3.1-405B 각종 벤치마크 결과를 정리한 표에 따르면 Qwen2.5-Max는 모든 테스트에서 가장 높은 점수를 기록했다. Qwen2.5-Max는 여러 테스트에서 GPT-4o와 DeepSeek-V3 성능을 뛰어넘었다.

Qwen2.5-Max는 알리바바 클라우드 API를 통해 사용할 수 있다. 또 큐원이 제공하는 채팅 AI인 큐원챗(Qwen Chat)에서도 Qwen2.5-Max를 이용할 수 있게 됐다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

모든 기사 보기