자동텍스트생성 AI GPT-3, 하루 45억 단어 출력중

AI 연구 조직인 오픈에이아이(OpenAI)가 만든 자동 문장 생성 AI인 GPT는 출시 전 연구자가 정확한 텍스트를 출력하기 때문에 너무 위험하다는 기술적 지적을 해 논문 출판을 연기하기도 했던 고급 언어 모델이다. 최신 버전인 GPT-3은 2020년 6월 공개됐는데 10개월 만에 GPT-3 API를 이용한 응용 프로그램은 300개가 넘으며 이 API는 하루 45억 단어 이상을 출력하고 있는 것으로 밝혀졌다.

기계학습에서 가장 큰 트렌드 가운데 하나는 텍스트 생성이다. AI를 이용한 시스템이 인터넷에 있는 수많은 텍스트에서 학습해 텍스트 생성 정밀도를 높이려 한다. AI를 이용한 텍스트 생성은 다른 분야보다 꽤 진행되고 있으며 이미 인간 블로그와 혼동될 만한 문장을 쓰고 인터넷 커뮤니티 레딧에서 누구에게도 들키지 않고 인간과 대화할 수 있는 수준에 도달했다.

이런 AI를 이용한 텍스트 생성기 중 가장 유명한 게 바로 GPT-3이다. GPT-3을 쉽게 이용할 수 있도록 하기 위한 API는 처음에는 무료로 제공됐지만 2021년 7월부터는 유료로 제공을 시작한다. 오픈에이이 입장에서 첫 상용 제품이 된 GPT-3 API는 출시 9개월 만에 300개 이상 서로 다른 앱에서 사용되며 하루 평균 45억 단어를 생성하고 있다고 한다.

고객 피드백을 분석하는 비에이블(Viable)이라는 도구는 GPT-3을 이용해 채팅 로그와 리뷰 등 텍스트 정보에서 감정과 테마를 식별하고 통찰력을 정리해 사용자에게 제공한다. 또 디지털 콘텐츠 스튜디오 페이블스튜디오(Fable Studio)는 가상현실 게임(Wolves in the Walls) 주인공 루시에 GPT-3을 이용해 게이머와 루시가 자연스러운 대화를 하도록 연출하고 있다.

오픈에이아이는 API 버전 GPT-3 활용 사례가 늘어나고 있다는 점을 대대적으로 알리고 있지만 언어 모델도 다른 알고리즘과 마찬가지로 유해한 편견에 의해 편향된 지식을 축적하는 경향이 있다는 지적도 나온다. 실제로 GPT-3에 대해 반이슬람 편견이 존재한다는 연구 논문이 발표되기도 했다.

한편 오픈에이아이는 편견이나 오용을 방지하기 위해 API 버전 GPT-3이 이용되는 모든 앱에 대해 궁극적으로 GPT-3 사용 승인 여부 검토를 실시하고 있다고 밝혔다. 또 개발자에 대해서도 개발 환경에 마이그레이션하기 전에 속도 제한이나 사용자 검증 등 안전 대책 구현을 요구하고 있다. 또 오용이나 앱 취약점을 적극 감시하는 레드팀을 구성하고 엄격한 평가를 실시하고 있다고 어필하고 있다. 관련 내용은 이곳에서 확인할 수 있다.