테크레시피

메타 언어 모델, 검색엔진‧계산기 API로 호출한다

챗GPT는 자연 언어 처리에 큰 변화를 가져왔다고 해도 좋은 존재지만 팩트체크나 수학이라는 기본 태스크로 문제가 나오는 일이 있다. 메타 대규모 언어 모델인 툴포머(Toolformer)는 언어 모델 부분을 희생하지 않고 외부 도구를 API를 통해 사용하는 방법을 학습하고 있으며 검색엔진, 계산기, 캘린더 등을 사용할 수 있다.

툴포머는 어떤 API를 호출할지, 언제 호출할지, 어떤 인수를 전달할지 그리고 결과를 미래 토큰 예측을 최적으로 통합하는 방법을 결정하도록 훈련된 모델이라는 것. 교육에서 연구자는 각 API를 사용하는 방법을 보여주는 사람이 만든 소형 샘플 세트를 제공하고 잠재적 API 호출로 대규모 언어 모델 데이터세트에 주석 달기를 허용한다. 인간의 명시적 지도 없이도 학습할 수 있도록 한 결과 툴포머는 텍스트 기반 API 호출을 다른 형식 텍스트인 것처럼 예측하는 걸 학습했다고 한다.

지금까지 대규모 언어 모델은 수학에 어울리지 않았지만 툴포머는 API에서 계산기를 호출해 이 문제를 피할 수 있다. 보도에선 대규모 언어 모델이 API를 호출할 수 있도록 해 앱 내 사용자 데이터에 손해를 주거나 브라우저 등을 통해 외부에서 문제를 일으킬 수 있다고 지적하고 있다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독

Most popular