블룸버그는 지난 10년간 소비자 뉴스 분야에서도 성공을 거뒀지만 원래 데이터 기업이며 현재도 실시간으로 시장 데이터 등을 입수할 수 있는 블룸버그 터미널 등 유료 서비스를 제공한다. 이런 블룸버그가 금융 관련 뉴스와 데이터를 이용해 학습한 AI 모델인 블룸버그GPT(BloombergGPT)를 발표했다.
블룸버그는 금융 특화 대규모 언어 모델(BloombergGPT: A Large Language Model for Finance)이라는 논문을 발표했다. 이 대규모 언어 모델 LLM은 금융 업계에서 다양한 자연 언어 처리 작업을 지원하기 위해 금융 데이터를 사용해 특별히 학습된 AI 모델이다. LLM 기반 AI 진화는 많은 분야에서 흥미로운 결과를 가져오고 있지만 금융업계 복잡성과 전문 용어를 고려하면 금융업계에 특화된 AI 모델이 필요하다고 논문에선 주장하고 있다. 블룸버그GPT는 금융업계 LLM 기반 AI를 적용하기 위한 첫 단계로 감정 분석, 고유 표현 인식, 뉴스 분류, 질의응답 등 블룸버그가 기존 금융업계에서 실시하는 자연 언어 처리 태스크 개선이 도움이 될 수 있다.
또 블룸버그GPT는 블룸버그 터미널을 사용할 수 있는 엄청난 데이터를 이용해 회사 고객에게 더 나은 지원을 제공할 기회를 개척하고 동시에 AI 가능성을 금융 분야에도 극대화가 가능하다고 한다.
블룸버그 측에 따르면 블룸버그GPT 파라미터 수는 500억이다. 금융 관련 자연 언어 처리 작업을 지원하기 위해 블룸버그 데이터와 공동 데이터세트를 독자 조합해 처음부터 구축됐다고 한다. 블룸버그에 따르면 블룸버그GPT는 7,000억 개 이상 토큰이나 단어 조각인 코퍼스에서 학습을 받았다고 한다. 2020년 출시된 오픈AI GPT-3은 5,000억 토큰으로 훈련됐다. 이 학습 데이터 중 3,630억 토큰은 블룸버그가 지금까지 수집해온 금융 데이터이며 지금까지 구축되어 온 금융 업계 고유 데이터세트로 최대라고 한다. 또 나머지 3,450억 토큰은 다른 곳에서 입수한 번용 데이터세트다. 블룸버그GPT 학습에 사용되는 범용 데이터세트에는 대규모 코퍼스(The Pile)가 포함된다.
블룸버그GPT는 범용 데이터세트를 이용해 범용 LLM을 구축하는 것도 금융업계 고유 데이터를 이용해 소규모 LLM 을 구축하는 것도 아니며 2개를 합친 접근법을 취하고 있다. 일반 AI 모델은 많은 영역을 커버하며 다양한 작업에서 높은 수준 성능을 실현한다. 하지만 블룸버그GPT는 금융업계 고유 데이터로도 학습해 금융 관련 벤치마크에서 동급 최고 결과를 달성하며 범용 LLM용 벤치마크에서도 경쟁력을 유지할 수 있게 됐다.
블룸버그GPT는 500억 파라미터를 보유하고 있지만 같은 규모 파라미터를 갖는 AI 모델과 비교하면 최고 수준 퍼포먼스를 발휘하고 있다는 것. 또 더 많은 매개변수를 가진 AI 모델과 비교해도 블룸버그GPT는 일부 작업에서 성능이 더 뛰어났다.
블룸버그GPT는 다른 LLM과 같은 데이터세트로 학습되고 있기 때문에 챗GPT 등에서 기대할 수 있는 태스크를 실행하는 게 가능하다. 하지만 블룸버그 요구에 밀접하게 관련된 작업을 수행할 수 있으며 블룸버그 뉴스 기사 스타일 제목을 만들 수도 있다.
보도에선 블룸버그GPT는 애널리스트를 대체할 존재가 될 가능성이 있다. 블룸버그GPT는 기본적으로 채팅 기반으로 작동해 재무 담당자 데이터 수집, 정리, 출력을 도와주는 도구다. 기본 재무 워크플로는 반복적이기 때문에 채팅 기반 블룸버그GPT와 궁합이 좋고 블룸버그GPT라면 휴일도 없기 때문에 언제든 빠르게 답변을 출력, 인간 애널리스트와 비교해도 장점이 있다는 것이다.
블룸버그GPT 목표는 재무 작업에서 동급 최고 AI 모델이 되는 것이다. 장기적으로 보면 대규모 디지털화된 아카이브를 보유한 출판사도 블룸버그GPT 같은 AI 모델을 활용할 길이 열릴 수 있다. 물론 블룸버그가 만드는 것과는 근본적으로 다른 규모이며 공개 도구보다 내부 도구로 유용할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.