챗GPT는 2022년 11월 공개 직후부터 급속도로 보급되어 법률 관련 상담이나 챗GPT를 활용해 게임을 개발하는 등 다양한 분야에 이용되고 있다.
챗GPT는 오픈AI에 의해 개발된 채팅 AI로 GPT-3.5나 GPT-4 등 언어 모델을 기반으로 하고 있다. 오픈AI는 챗GPT를 공개하기 2년 이상 전인 2019년 2월 언어 모델인 GPT-2를 공개했지만 GPT-3.5나 GPT-4는 GPT-2와는 크게 다른 점이 존재한다.
원래 GPT-2 같은 언어 모델은 올바른 문장을 생성하는 구조가 아니며 입력이 계속될 가능성이 높은 문장을 생성하도록 개발되고 있다. 예를 들어 GPT-2에 ~로 유명한 소설가(A famed novelist well-known for)라는 문장을 입력하면 문학적인 리얼리즘으로 유명한 소설이이다. 저자는~(A famed novelist well-known for its literary realism~) 식으로 자연스러운 문장을 생성해준다. 하지만 GPT-2에 의한 문장 생성은 무작위성이 상당히 높았고 사용자가 의도한 내용 문장을 생성하는 건 어려웠다.
2020년 5월 공개된 GPT-3은 GPT-2보다 고도의 문장 생성 기능을 갖추고 있었지만 의도한 내용 문장을 생성하는 건 어렵다는 문제는 남아 있었다. 오픈AI는 이 문제를 해결하기 위해 생성 결과에 대한 사용자 피드백을 학습하는 메커니즘을 도입한 GPT-3 개선 모델(InstructGPT)을 2022년 1월 공개했다. 인스트럭트GPT 등장 이전에는 ~를 생성하라는 입력 프롬프트에 따라 언어 모델이 출력을 돌려 처리가 종료됐지만 인스트럭트GPT에선 생성 결과를 근거로 한 지시로 처리할 수 있게 됐다.
오픈AI는 GPT-3과 인스트럭트GPT를 결합해 지시와 응답 캐치가 가능한 언어 모델인 GPT-3.5를 개발했다. GPT-3.5에 채팅 앱 같은 친숙한 UI를 부여한 게 챗GPT로 챗GPT는 사용 용이성과 답변 정확성 등이 평가되어 폭발적인 인기를 얻게 됐다.
전통적인 컴퓨터는 CPU가 프로그램에 따라 메모리로부터 필요한 데이터를 꺼내면서 처리를 실행해 출력한다는 흐름으로 동작한다. 프롬프트를 프로그램, 입출력, 이력을 메모리에 내세우면 챗GPT는 언어 모델이 프롬프트에 따라 입출력 이력에서 필요한 데이터를 검색하면서 처리를 실행해 출력한다는 전통적인 컴퓨터와 비슷한 동작이 가능하다.
따라서 사용자별 보험 계약에 대한 정보가 포함된 프롬프트를 사용해 사용자별 계약 내용에 따라 제안을 하는 응용 프로그램을 개발하거나 로봇을 제어하기 위한 구문, 로봇에 기대하는 동작을 프롬프트로 입력해 예상대로 동작을 실행할 수 있는 로봇 제어문을 생성하는 등 조작을 실행할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.