테크레시피

바이두가 발표한 GPT-3.5 웃도는 AI 모델?

중국 검색 기업인 바이두가 자사 AI 모델인 어니(Ernie) 최신 버전인 어니 3.5를 발표했다. 바이두는 발표를 하면서 어니 3.5는 오픈AI의 GPT-3.5를 뛰어 넘고 중국어 능력에선 GPT-4를 웃돌았다고 밝혔다.

어니 3.5는 인간 인지, 능력과 관련된 작업에 대한 지표를 측정하는 마이크로소프트 리서치의 벤치마크인 AGIEval과 상하이교통대학, 칭화대, 에든버러대가 공동으로 만든 중국어 성능을 측정하는 벤치마크인 C-Eval, 버클리대와 콜롬비아대, 일리노이대 아바나샴페인, 시카고대가 공동 출시한 멀티태스킹 성능을 측정하는 벤치마크인 MMLU 평가를 받고 있다. 이런 벤치마크 테스트에서 어니 3.5는 AGIEval과 C-Eval에서 GPT-3.5를 뛰어 넘는 성능을 발휘한 것으로 보고됐으며 AGIEval과 C-Eval 중국어 성능은 GPT-3.5 후속 모델인 GPT-4를 웃도는 게 확인됐다고 한다.

어니 3.5는 바이두가 제공하는 채팅 AI인 어니봇(ERNIE Bot) 버전 2.0에 내장되어 있으며 테스트 사용자는 언제든 서비스에 액세스해 어니 3.5 성능을 경험할 수 있다고 밝히고 있다. 어니 3.5의 특징적 기능은 플러그인으로 바이두 검색 기능과 어니 3.5를 결합하는 고품질 플러그인과 타사 개발자 플러그인을 통합해 어니 3.5 기능을 확장할 수 있다는 강점이 있다고 바이두는 밝혔다. 바이두 창업자인 리옌홍은 AI 모델은 전 세계 경제 성장을 선도하는 엔진이며 놓칠 수 없는 큰 전략적 기회라고 밝히고 있다.

중국에선 챗GPT가 공식 제공되지 않지만 챗GPT는 화제를 석권하고 있는 상태로 국민 AI에 대한 관심은 계속 높아지고 있다. 한편 중국 정부가 기업 제품이 중국 사회주의적 가치관을 지지하는 것 등으로 규정한 제너레이티브 AI에 관한 법률 제정을 서두르고 있으며 이번 어니 3.5를 발표한 바이두를 비롯한 중국 AI 기업도 대응에 쫓기는 것으로 보인다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독