대규모 언어 모델(LLM)을 이용한 생성 AI는 인간과 협업할 수 있다. 과학 저널 사이언스어드밴스드(Science Advances)에 게재된 논문에서는 생성 AI가 개인 창의성을 높인다는 게 실증됐지만 한편으로 생성 AI에 의존해 창작에 문제가 발생할 가능성도 지적되고 있다.
영국 런던대 유니버시티 칼리지 연구팀은 생성 AI와 인간 창의성 관계를 이해하기 위한 첫 걸음으로 생성 AI가 창의적인 단편소설을 만들 수 있는지는 실험을 실시했다. 연구팀은 생성 AI가 창의적인 집필 활동에 영향을 미치는 방법으로 아이디어 발판으로 출발점을 제시한다와 작가가 막히는 걸 극복하기 위한 새로운 아이디어를 제공한다는 2가지 역할이 있다고 생각하고 있다. 따라서 생성 AI가 작가에게 아이디어를 제공하고 해당 아이디어로부터 작성된 단편소설의 창의성이 높은지를 평가해써 생성 AI의 가능성을 탐구했다.
실험에서는 먼저 작가 참가자 293명을 100명씩 3개 팀으로 나누고 모두에게 10대~20대 초반을 위한 8문장 정도 짧은 이야기를 쓰도록 요청했다. A그룹은 그 이야기를 스스로 작성하고 B그룹은 이야기 작성 영감이 될 아이디어를 GPT-4로부터 1개 받고 C그룹은 GPT-4로부터 아이디어를 5개까지 받을 수 있다. 완성된 이야기는 600명 별도 그룹에 의해 이야기의 신규성, 출판 가능성, 감정적 특성 등 항목으로 평가됐다. 이때 평가자는 AI에 의해 쓰인 부분을 포함하는지 여부를 사전에 모른 채 이야기를 읽은 뒤 어떤 게 생성 AI를 사용한 이야기인지 추측했다.
생성 AI의 아이디어를 채택할지 여부는 참가자 자유였지만 전체적으로 B그룹 82%가 아이디어 제공을 수용했다. 또 5개까지 아이디어를 받을 수 있는 C그룹 중 93%가 최소 1개 아이디어를 채택했고 25% 정도가 5개 모든 아이디어를 요구했다고 한다.
결과적으로 생성 AI의 아이디어를 포함한 B그룹과 C그룹은 이야기의 신규성이나 출판 가능성 평가가 향상되는 것으로 나타났다. 아이디어 1개를 받는 B그룹은 GPT-4의 도움을 받지 않은 A그룹에 비해 이야기의 신규성에서 평균 5.4%, 출판 가능성에서 평균 3.7% 평가 점수가 높아졌다. 더구나 아이디어를 5개 중에서 선택할 수 있는 C그룹은 A그룹에 비해 신규성에서 평균 8.1%, 출판 가능성에서 평균 9%나 평가 점수가 높아진 것으로 나타났다.
다음으로 이야기가 얼마나 잘 쓰였는지, 즐거운지, 재미있는지, 지루한지, 이야기에 얼마나 반전이 있는지 등 일반 독자 관심 카테고리를 기반으로 한 이야기에 대한 평가자의 감정적 특성을 평가하는 항목에서는 B그룹과 C그룹이 A그룹보다 모두 높은 평가를 받았다. 하지만 이 이야기가 재미있냐는 질문에 관해서만 아이디어를 많이 받은 C그룹이 단일 아이디어인 B그룹보다 점수가 낮았고, 그 둘 다 A그룹의 작품보다 낮았다. 다만 이 차이는 작아 통계적으로 유의하지 않다고 논문은 언급하고 있다.
연구팀은 이번 결과에 대해 생성 AI가 제공하는 창의성에 관해 효과의 크기가 그리 크게 점수가 상승한 건 아니지만 통계적으로는 유의미한 차이가 보였지만 본질적으로 창의적인 이들의 이야기가 AI 아이디어로 강화됐다고는 생각되지 않으며 오히려 창의성 지표에서 높은 점수를 받은 사람은 생성 AI로 인해 추가 평가를 받지 못했고 전혀 이익을 얻지 못하거나 오히려 마이너스 영향을 미칠 가능성도 시사됐다면서 생성 AI의 혜택을 받는 건 원래 상상력이 낮은 작가들이라고 말했다.
또 연구팀은 창작 아이디어에 생성 AI를 사용할 때의 주의점으로 작품이 균질화되어 버린다는 문제를 지적하고 있다. 참가자 평가와는 별도로 연구팀은 오픈AI API를 사용해 각 이야기가 같은 카테고리의 다른 작품과 얼마나 유사한지를 분석했다. 결과적으로 생성 AI를 이용한 그룹은 다른 참가자가 작성한 같은 카테고리의 이야기와 유사성이 높고 전체적인 다양성이 낮아졌다고 한다.
연구팀은 이번 연구는 아직 시작 단계이며 포함되지 않은 요소도 많다고 인정하면서도 이상적으로는 이런 연구가 글쓰기, 예술, 음악 등 창의적인 아이디어의 다양성을 지속적으로 확보하기 위해 기술과 그것과의 관계 모두를 이끄는 데 도움이 될 것이라며 AI 사용을 평가하는 건 잠재적인 단점에 빠지지 않고 이 잠재적으로 변혁을 가져올 기술 혜택을 확실히 누리기 위해 필수적일 것이라는 말로 연구 의의에 대해 말했다. 관련 내용은 이곳에서 확인할 수 있다.