메디트론(Meditron)은 메타 대규모 언어 모델인 LLaMA2를 기반으로 의학서를 학습한 이료 전문 LLM 스위트다. 의료 분야 관련 능력은 GPT-3.5를 상회하는 것으로 보고되고 있다.
채팅 서비스인 챗GPT가 각종 서비스에 사용되고 있으며 금융이나 과학 등 특정 분야에 특화한 모델이 잇달아 등장하고 있다. 의료 분야 특화 모델에 대해서도 다양한 대처가 이뤄져 왔지만 결과적으로 탄생한 모델은 GPT-4 같은 클로즈드 소스이거나 혹은 규모가 크지 않은 것 뿐이었다. 이런 상황에 눈을 돌린 스위스연방공대 로잔 연구팀이 만든 LLM 스위트가 메디트론으로 발표와 동시에 LLM(Meditron-7B, Meditron-70B)가 공개됐다.
메디트론-7B와 메디트론-70B는 모두 LLaMA2를 기반으로 펍메드(PubMed) 논문과 초록, 국제적으로 인지된 의학 가이드라인을 포함한 문서로 학습된 모델로 이런 데이터를 바탕으로 의학적 지식을 출력하도록 설계됐다.
의료 분야 성능을 측정하는 벤치마크 실시 결과 메디트론-70B는 무료 버전 챗GPT에 사용되는 LLM인 GPT-3.5나 구글 의료용 LLM인 메드-PaLM(Med-PaLM)을 웃돌아 GPT-4나 메드-PaLM-2 비슷한 성능을 보였다고 한다. 이런 성능을 내는 LLM이 새롭게 오픈소스로 공개된 것으로 LLM 의학 지식과 추론 능력이 널리 사용되게 될 것으로 기대되고 있다. 구체적으론 진찰이나 진단 보조, 질환 정보 조회라는 사용예가 상정된다고 한다.
현재 메디트론 제품군은 시험과 평가를 위한 사용이 권장되며 안전하거나 전문적으로 생산 환경에서 사용하기에는 적합하지 않다. 또 이 모델을 사용해 텍스트를 생성하는 건 가능하지만 약물 등 생산이나 사람에 영향을 미칠 수 있는 작업에 직접 사용해선 안 된다고 밝히고 있다. 관련 내용은 이곳에서 확인할 수 있다.