GPT-4 웃도는 특정 언어 특화형 LLM

이원영 기자

2023.07.14

챗GPT가 주목받는 가운데 챗GPT에 필적하는 성능을 어필하는 언어 모델이 잇따라 발표되고 있다. 상하이AI연구소 중심으로 개발한 언어 모델인 인턴LM(InternLM)은 영어와 중국어에 특화해 학습되고 있으며 여러 성능 평가 테스트에서 챗GPT 이상 점수를 기록하고 있다.

인턴LM은 1조 토큰 이상 다국어 데이터로 학습된 것이다. 특징을 보면 여러 언어를 이해하고 표현하는 능력을 갖추고 있으며 그 중에서도 영어와 중국어에서 현저한 성능을 발휘한다. 또 논리적 추론과 코드 생성 등 분야에서도 뛰어난 성능을 내며 다양한 중국어 성능 평가 테스트에서 챗GPT를 넘어 GPT-4에 가까운 성능을 발휘한다.

마이크로소프트 언어 모델 성능 평가 테스트(AGIEval)에서 인턴LM이 챗GPT를 모든 요소에서 능가한다고 한다. 언어 모델 중국어 처리 성능을 평가하는 테스트(C-Eval)에서도 인턴LM은 대부분 테스트에서 GPT-4 점수를 웃돈다.

인턴LM은 챗GPT와 같은 채팅 형식으로 상호 작용할 수 있으며 문장 지시에 따라 코드를 생성할 수도 있다. 인턴LM 모델 데이터는 깃허브 리포지토리에 게시되어 있다. 관련 내용은 이곳에서 확인할 수 있다.

이 글 공유하기:

추천기사