파인튜닝용 AI 모델, 특정 태스크에서 GPT-4 능가

이원영 기자

2023.12.29

미스트랄 7B 파인-튠 옵티마이즈드(Mistral 7B Fine-Tune Optimized)는 기존 AI 모델에 학습 데이터를 추가하고 자신이 좋아하는 데이터를 출력하도록 조정하는 파인튜닝용 모델이다. 이 모델로 파인 튜닝을 실시하면 GPT-4를 넘어선 성능을 발휘하는 일도 있다고 한다.

원래 모델은 미스트랄AI가 개발한 대규모 언어 모델인 미스트랄7B다. 미스트랄7B 파인-튠 옵티마이즈드는 미스트랄 7B에 더 미세 조정을 실시하기 위한 기본 모델이 되도록 최적화된 모델이며 모델 지시 이해와 추론 능력을 최적화할 수 있다.

실험적으로 채택한 4가지 작업 평균을 보면 미스트랄 7B 파인-튠 옵티마이즈드로 미세 조정된 미스트랄 7B는 GPT-4보다 조금 높은 성능을 냈다고 한다. 연구팀은 GPT-4 등은 범용 모델이며 특정 태스크에선 파인튜닝한 것과 같은 뭔가 특화된 모델보다 뒤떨어지는 일이 있다고 지적한다. 전체 능력이 낮은 모델이라도 몇 시간에 걸쳐 파인 튜닝된 모델은 한 태스크를 효율적으로 해낼 수 있게 된다고 밝혔다.

제작 과정에선 18개 임시 모델이 탄생했지만 복수 모델을 융합한 모델이 높은 성능을 나타내 이를 한층 더 개선해 미스트랄 7B 파인-튠 옵티마이즈드가 탄생했다고 한다. 이미 미스트랄 7B 파인-튠 옵티마이즈드는 허깅페이스에 공개되어 있다. 관련 내용은 이곳에서 확인할 수 있다.

이 글 공유하기:

추천기사