스테이블 디퓨전이나 미드저니 같은 이미지 생성 AI, 챗GPT나 구글 바드 같은 대화형 AI가 등장하며 지금까지 인간 밖에 창작할 수 없던 그림이나 문장을 AI가 인간 수준 정밀도로 생성할 수 있게 됐다. 물론 정확성과 신뢰성에는 의문의 목소리도 높아지고 있으며 학생 17%가 시험과 과제에 챗GPT를 사용하고 있다는 보고가 나오는 등 교육 현장에서 AI 이용을 금지해야 한다는 의견이 쏟아지고 있다. 이런 가운데 대학이나 고등학교에서 자동 생성 AI를 어떻게 사용 평가할지 학생에게 지도하는 시도가 이뤄지고 있다.
펜실베이니아대학 이단 모릭 교수는 학부와 대학원 석사 과정에서 수업으로 AI 사용을 학생에게 부과했다. 한 수업에선 아이디어 창출과 문장 작성, 앱 작성, 이미지 생성 등 AI를 사용하도록 지시했다는 것. 또 다른 과제에선 과제에 AI 사용을 의무화하거나 허가하기도 했다. 또 다른 수업에선 AI를 소개하고 사용법을 생각하도록 지시했다.
모릭 교수에 따르면 지금까지 다른 강사나 교수로부터 챗GPT 자체는 꽤 자연스러운 문장을 쓸 수 있는데 AI를 사용한 작문 과제는 심한 게 많다고 평가되고 있었다고 한다. 실제로 학생에게 AI를 사용하도록 했는데 처음에는 AI를 잘 다루지 못하는 경우가 대부분이었다고 한다.
예를 들어 모릭 교수는 주어진 주제에 대해 짧은 논문을 작성하는 과제를 학생에게 냈다. 학생은 AI 사용을 부과받고 작문을 AI에 그대로 해주거나 혹은 소논문에 어울리는 일러스트를 작성하게 했다. 하지만 실제로 해당 소논문을 읽어 보면 대부분인 평범하고 성적은 기껏해야 C 마이너스에 머물렀다는 것.
모릭 교수는 과제를 낼 때 챗GPT에 입력하는 프롬프트를 복수 입력하도록 지시했다고 한다. 따라서 학생이 입력한 프롬프트를 체크하면 대략 모든 걸 AI에 맡겼는지, AI가 쓰는 내용을 사용자가 결정하고 자신이 알고 있는 지식 범위도 나타내는지, AI가 쓴 내용을 체크한 뒤 문장을 교정하고 세세하게 재작성시키는지 3가지 접근법으로 나뉘어져 있는 걸 알 수 있었다.
첫 번째 접근법으로 쓰인 소논문은 아무래도 평범한 내용이 된다. 2번째 접근법은 첫 번째 접근법으로 작성된 소논문보다 내용이 뛰어나지만 결과에 편차가 많았다. 내용이 가장 뛰어난 건 3번째 방법으로 출력된 것이었다고 한다. 학생에게 소논문을 제출시킨 뒤 모릭 교수는 다시 3번째 접근법을 바탕으로 AI에 지시하는 방법을 가르쳤는데 결국 소논문 완성도가 극적으로 개선됐다는 것. 많은 교육자가 AI는 신뢰도가 낮다는 점을 우려하고 있지만 모릭 교수는 수업을 통해 학생은 AI 신뢰성이 낮다는 걸 곧바로 이해하고 AI가 썼고 내용에 대해 주의 깊게 팩트체크를 하고 있었다고 한다. 하지만 팩트 체크 자체 정확도가 낮기 때문에 챗GPT에 속을 가능성을 더 고려해야 할 것이다.
또 뉴욕 공립고등학교에선 컴퓨터사이언스 교사가 크리티컬 컴퓨팅 수업을 실시하고 있다고 한다. 이 수업에선 컴퓨터 프로그래밍 뿐 아니라 AI를 비판적 사고를 바탕으로 이해하는 걸 목표로 한다. 이 수업에선 주로 백인이나 아시아 남성으로 이뤄진 IT 기업팀이 개발한 얼굴 인식 AI가 흑인과 라틴계 얼굴을 인식하기 어려울 수 있다는 걸 토론한다. 또 AI에서 볼 수 있는 바이어스를 해결하기 위해선 어떻게 하면 좋을지도 논의하고 있다고 한다.
이 수업 강사는 챗GPT를 이용해 30분간 수업 플랜을 작성해 그대로 수업을 진행했다. 실제로 강사가 작성하는 수업 계획과 비교해 학생은 챗GPT에 의한 수업 유용성과 문제점을 논의한다. 모릭 교수는 자신은 AI를 받아들이지 않았다고 해도 AI가 학생 주위 모든 곳에 존재하는 건 분명하다며 AI를 사용하면 효과가 향상될 것으로 기대하고 있다. 관련 내용은 이곳에서 확인할 수 있다.