생성형 AI는 고급 문장과 이미지를 생성할 수 있는 반면 AI를 학습하기 위한 데이터를 다루는 게 종종 문제가 되고 있다. 작가 활동 지원과 저작권 관련 지원도 실시하는 비영리 단체인 미국SF판타지작가협회 SFWA(Science Fiction and Fantasy Writers Association)는 미국 저작권국에 제출한 서한에서 AI 학습에 작품이 사용되는 것에 반대하는 이유를 명확히 했다.
AI를 학습하기 위한 데이터세트가 저작권과 개인 정보를 침해하는 문제는 종종 지적되어 왔다. 과거에는 챗GPT 개발사인 오픈AI가 학습용 데이터를 둘러싸고 집단 소송을 당하거나 메타 대규모 언어 모델인 LLaMA 학습에도 사용된 북스3(Books3)를 삭제하라며 저작권 침해 대책 그룹이 요청하는 문제도 보도됐다. 또 학습에 사용된 작품이 공식 수단이 아니라 해적판이었던 게 발각되며 불법 데이터라는 게 문제시된 경우도 있다.
SFWA는 SF와 판타지 작품을 발표하는 크리에이터 2,500명 이상이 소속되어 있는 비영리단체로 출판업계 사기나 조사, 주의 환기, 출판 문제 중재, 저작권 문제 조사와 대처 등 작가 지원을 실시하고 있다. 미국 저작권국이 지난 8월경 AI에 의해 발생하는 문제에 대한 의견을 널리 물었고 SFWA는 10월 30일 AI 도구가 가져오는 이 시장에 대한 손해와 저작권 위협 문제가 의회와 정부 관료에게 알려져야 한다며 저작권국에 서한을 보냈다.
SFWA 이사회는 커뮤니티 내에서 AI와 저작권 문제에 관해 광범위한 의견이 있다며 AI가 자신의 경력에 미치는 영향에 대해 알게 하는 게 목적이라고 밝혔다. SFWA 주장에선 주로 페어유스 관점에서 서적에 대한 자유로운 공유가 장려되던 상황에서 AI가 이런 작가의 관대함을 악용하고 있다는 걸 문제시했다. SFWA는 해적판 서적이 AI 학습에 사용되선 안 되는 건 물론 작가가 스스로 공개한 책이라도 마찬가지로 AI 학습을 위해 무제한으로 사용되선 안 된다고 밝히고 있다.
AI 도구가 연구나 학술 같은 비영리 목적으로 회원 저작물을 사용해도 불쾌감을 느끼지 않지만 작가를 포함한 창조적 노동자가 AI로부터 혜택을 받거나 비용을 지불하는 대신 글쓰기와 출판 사업에 손해를 끼치고 있다고 지적했다. 결론적으로 AI 유행은 작성자와 소비자 모두에게 잠재적으로 치명적인 프로세스의 시작일 뿐이라고 밝혔다.
SFWA는 크리에이터를 보호하고 미래 창작 능력을 유지하기 위한 구제책으로 4가지를 제안하고 있다. 첫째 AI에 의해 작성된 문장은 AI에 의한 것이라고 누구나 알 수 있도록 명시해야 한다. 둘째 SFWA는 작품 일부가 AI에 의해 만들어진 것에도 몇%가 AI에 의한 것인지 명확하게 할 걸 요구하고 있다. 셋째 AI가 생성한 작품에 저작권을 인정하기 전에는 학습 데이터에 포함된 모든 라이선스 또는 법적 권리를 증명해야 한다. 넷째 학습 데이터에 사용한 작가는 암시적 이해가 아닌 명시적 허가를 받아야 하며 명확한 라이선스 없이 AI가 작성한 작품은 항상 저작권을 침해하는 것으로 취급되어야 한다는 주장이다.
SFWA 측은 SF와 판타지 작가로서 자신들은 AI 시스템을 전 세계에 가져온 연구자의 궁리를 통해 자신들의 권리를 완전히 존중한 연구를 수행할 방법을 찾아낼 것이라고 확신한다고 서한을 마무리했다. 관련 내용은 이곳에서 확인할 수 있다.