1600개 이상 API 호출 가능한 AI 언어 모델

최근에는 챗GPT나 바드 등 대화형 AI가 잇따라 출시되어 인간 질문이나 호소에 대해 더 정밀한 대답을 할 수 있는 것으로 주목받고 있지만 이런 대화형 AI는 때론 진실처럼 말하는 환각을 일으킬 수 있다. 여기에서 방대한 API로부터 적절한 걸 호출해 환각을 대폭 줄일 수 있는 언어 모델 고릴라(Gorilla)를 미국 캘리포니아대학 버틀리와 마이크로소프트 리서치 연구팀이 공개했다.

대규모 언어 모델은 최근 놀라운 발전을 이루고 있으며 프로그래밍 코드를 작성하거나 긴 문장을 정확하게 요약하는 등 다양한 작업에서 뛰어난 능력을 발휘하고 있다. AI는 외부 API를 호출해 이용하는 것도 가능하지만 지금까지의 AI는 방대한 API 중에서 적절한 걸 선택해 효과적으로 이용하는 게 곤란했다고 한다.

연구팀은 이는 GPT-4와 같은 첨단 대규모 언어 모델조차도 어려운 과제라며 주된 이유는 정확한 입력 인수를 생성할 수 없다는 것이며 환각이 나오는 경향이 있다고 지적하고 있다. 따라서 연구팀은 API 호출 기술에 있어 GPT-4 성능을 옷돌도록 조정된 메타가 개발한 대규모 언어 모델인 LLaMA(Large Language Model Meta AI) 기반 모델인 고릴라를 출시했다.

고릴라는 수많은 파일 API에서 적절한 걸 선택하는 검색 기능을 갖고 있으며 자연어 쿼리에서 의미적으로나 구문적으로 올바르게 API를 호출하고 API 문서 업데이트와 버전 변경에 유연하게 대응할 수 있다고 한다. 또 고릴라에선 대규모 언어 모델에 직접 프롬프트를 출력할 때 발생하는 환각도 경감되고 있다고 한다.

Excited to release Gorilla Gorilla picks from 1000s of APIs to complete user tasks, surpassing even GPT-4! LLMs need to interact with the world through APIs, and Gorilla teaches LLMs APIs. Presenting Gorilla-Spotlight demo
Webpage: https://t.co/QZrtMaYKfa pic.twitter.com/h6aSeofcXu
— Shishir Patil (@shishirpatil_) May 25, 2023

고릴라 API 데이터베이스에는 터치허브에서 94, 텐서플로 허브 v2에서 626, 허깅페이스에서 925개 등 모두 1,645개에 이르는 API가 포함되어 있다. 이를 기반으로 훈련된 게 바로 고릴라다.

+ We are building Gorilla to be an LLM API appstore – you can add your APIs to Gorilla!
+ Github: https://t.co/mvZWjFQ1x7
+ Join our Discord to stay in the loop!
+ Gorilla-Spotlight sign-up: https://t.co/rvmk13Mhrx
+ Fun collaboration with @tianjun_zhang, @xinw_ai and @mejoeyg
— Shishir Patil (@shishirpatil_) May 25, 2023

고릴라는 엔드투엔드 모델이며 추가 코딩을 필요로 하지 않고 올바른 API를 호출하도록 조정되고 있다. 다른 도구(Langchain·Toolformer·AutoGPT)와 조합해 사용하는 것도 가능하다. 연구팀에 따르면 고릴라는 대규모 언어 모델 API 앱스토어가 되도록 구축됐으며 API를 고릴라에 추가할 수도 있다고 한다. 관련 내용은 이곳에서 확인할 수 있다.