테크레시피

“AI 검출기, 인간 학생 글 1∼2%를 AI 작성으로 오인식”

오픈AI 챗GPT가 생성 AI를 급격히 실용적인 수준으로 끌어올린 이후 학생 17%가 과제에 챗GPT를 사용해봤다고 답변한 한편 교사도 AI 검출기를 활용해 AI를 이용한 부정행위를 적발하려 하는 등 AI를 둘러싼 학생과 교사간 대립이 심화되고 있다. 보도에선 사람이 직접 작성한 글을 사용해 주요 AI 검출기를 검증한 결과 높지는 않지만 결코 무시할 수 없는 비율 오탐지가 발생했다고 보고했다.

보도에선 챗GPT 출시 이전에 작성된 에세이 500편을 주요 AI 검출기인 GPTZero와 Copyleaks에 적용한 테스트 결과 500편 중 3편이 AI로 생성된 것으로 판정됐고 9편이 부분적으로 AI를 사용해 작성된 것으로 오인됐다.

테스트에 사용된 에세이는 챗GPT가 일반 공개되기 전인 2022년 여름 텍사스 A&M 대학에 제출된 것이므로 AI로 생성되었을 가능성은 거의 없다. 또 자료 요청을 통해 입수된 것이므로 AI 학습에 사용된 적도 없다. AI가 출력한 것으로 오탐지된 에세이 중에는 거의 100% 확률로 AI 작성으로 판정된 것도 있었다고 한다.

그 중에서도 같은 단어나 표현을 반복적으로 사용하기 쉬운 발달장애 학생이나 제2외국어로서의 영어(ESL) 학습자가 오탐지될 가능성이 높다. 스탠포드 대학 조사에 따르면 AI 검출기는 미국에서 태어난 중학교 2학년 학생이 쓴 작문에서는 거의 완벽한 정확도를 보인 반면 영어가 모국어가 아닌 학생이 쓴 글 절반 이상을 AI 생성 텍스트로 식별했다고 한다.

오픈AI는 이전에 ESL 학생을 포함한 특정 그룹에 부정적인 영향을 미칠 수 있다는 우려를 이유로 챗GPT로 작성된 글을 99.9% 정확도로 검출할 수 있는 도구 공개를 보류한다고 발표한 바 있다.

자폐 스펙트럼으로 인해 AI 생성으로 오인되기 쉬운 정형화된 글을 쓰기 쉽다는 모이라 올름스테드는 이 문제에 휘말린 당사자 중 1명이다. 출산으로 인해 대학을 휴학한 뒤 육아와 교사가 되려는 꿈을 병행하기 위해 복학한 그는 AI 검출기 오인으로 필수 과목 과제 중 하나가 0점 처리됐다. 교수로부터 AI 검출 도구 점검에 대해 들었을 때의 충격을 그는 배를 맞은 것 같았다고 말한다.

교육 현장에 AI가 얼마나 침투해 있는지는 이제 불분명하다. 보도에선 챗GPT 출시 이후인 2023년 여름 제출된 에세이 305편을 앞서 언급한 AI 검출기에 적용한 결과 9%가 AI 생성으로 판정됐다.

언론 검증에서는 또 AI 생성 텍스트를 인간 글처럼 위장하기 위해 만들어진 자동 도구, 이른바 AI 휴머나이저에 의해 AI 검출기가 속는 사례가 있다는 것도 밝혀졌다. 구체적으로는 GPTZero에 의해 98.1% 정확도로 AI라고 오인된 에세이를 Hix Bypass라는 AI 휴머나이저로 보정했더니 판정 결과가 5.3%로 급감했다고 한다.

이런 상황은 대립하는 AI 기술 군비 경쟁으로 발전해 교육적 이점이 거의 없는 상태에서 교육자와 학생 사이에 깊은 균열을 초래할 위험이 있다는 지적이다.

교육자 중에는 AI 사용을 금지하는 대신 학생에게 AI를 올바르게 활용하게 하려면 어떻게 해야 할지를 모색하는 사람도 있다. AI 검출기가 아닌 자신의 감각을 바탕으로 과제를 평가하고 의심스러운 경우에는 학생과 직접 대화하려 한다는 메릴랜드 대학 영어학 교수 아담 로이드는 좋든 싫든 인공지능은 앞으로 필수불가결한 것이 될 것이라며 AI를 교실에서 배제하거나 학생에게 사용하지 말라고 권장하는 건 잘못된 생각이라고 말했다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사