오픈AI가 개발한 대화형 채팅 AI인 챗GPT(ChatGPT)는 연구자가 AI 생성이라고 볼 수 없는 논문 요지를 쓸 수 있을 만큼 정밀도가 높은 문장 생성력을 발휘하는 한편 공식적으로 주의 환기가 이뤄지고 있듯 정확하지 않은 정보를 그럴듯한 내용으로 문장을 생성하는 문제가 있다. 이 문제에 대응하기 위해 논문 도용 텍스트 검출 툴을 제공하는 턴잇인(Turnitin)이 챗GPT 문장을 검출하는 툴을 개발하고 있다고 한다.
보도에 따르면 턴잇인은 챗GPT에 사용되는 언어 모델인 GPT-3이 나왔을 때부터 AI 텍스트를 검출하는 툴 개발을 은밀하게 진행해왔다고 한다. 턴잇인 AI 담당 부사장인 에릭 원은 AI가 생성한 문장에 대해 가장 가능성이 높은 장소에서 가장 가능성이 높은 단어를 사용하고 있다는 게 크게 다르다고 차이를 밝히고 있다.
그에 따르면 인간은 무의식 중 눈을 좌우로 움직여 단어간, 단락간, 페이지간을 오가면서 문장을 읽고 있어 미래 마음 움직임까지 생각하지만 챗GPT는 이전 문장을 기반으로 새로운 단어를 생성하고 있을 뿐이어서 인간 문장에서 볼 수 있는 유연성이 없다고 한다.
턴잇인이 개발하는 툴은 특정 텍스트 단편으로 AI가 생성할 가능성이 높은 단어를 예측, 인간은 특정 장소에서 특정 단어를 일관성 있게 사용하는 경향이 없기 때문에 AI 텍스트인 걸 검출할 수 있는 구조다.
다만 검출 툴을 어떤 형태로 제공하는지에 대해선 아직 검토 중이며 텍스트 분량 중 어느 정도가 AI 생성인지를 나타내는 퍼센티지를 표시하거나 정확도 평가를 위해 툴 예측 신뢰도를 저중고로 나타내는 등 궁리를 하고 있다고 한다.
덧붙여 이 툴은 교육기관에서의 챗GPT 사용 금지를 목표로 설계한 게 아니라 교사와 학생이 서로를 신뢰해 기술을 신뢰할 수 있도록 하는 것이라고 한다. 콘텐츠 작성 방법과 작업 방법에 큰 변화가 학습 방법에도 미치고 있다면서 가르치는 방법에 대해 장기적으로 생각해야 하며 우리는 어떻게 배울 것인지에 대해서 고민해야 한다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.