10분에서 15분 정도 짧은 이야기 낭독 음성을 배포하는 오디오 플랫폼 포켓FM(Pocket FM)에 대해 콘테스트를 위해 수집한 음성 샘플을 AI 트레이닝에 사용한 게 아니냐는 지적이 제기되고 있다.
포켓FM은 2018년 설립된 오디오 플랫폼. 판타지, SF, 호러, 로맨스 등 다양한 장르 이야기를 10분에서 15분 정도 짧은 낭독 음성으로 배포하고 있으며 인도를 본거지로 20개국 이상에 진출해 있다. 2023년 기준 다운로드 수는 1억 건을 넘었다. 2024년에는 소설 투고 플랫폼 포켓 노블(Pocket Novel)도 출시해 15만 명이 넘는 작가에 의해 25만 편 이상 소설이 업로드됐다.
낭독 음성은 이전에는 내레이터와 편집자가 제작했지만 음성 AI를 다루는 일레븐랩스(ElevenLabs)와 제휴해 AI에 의한 자동 음성이 사용되기 시작했다.
일레븐랩스와 제휴를 맺은 것과 같은 시기 포켓FM은 인도에서 성우 발굴 콘테스트를 개최하고 참가자에게 영어, 힌디어, 타밀어, 텔루구어로 10분짜리 샘플 음성 제출을 요구했다.
성우 수르얀 싱은 콘테스트 조항에 참가자는 제출된 음성 샘플에 대해 포켓FM에게 사용, 복제, 수정, 각색, 번역, 배포, 공개, 파생 작품 제작 및 전 세계 모든 미디어에서의 표시에 관한 독점적, 로열티 프리, 영구적, 양도 가능, 취소 불가능 및 완전한 서브라이선스 가능한 권리를 부여한다는 내용이 있다는 점에서 포켓FM이 콘테스트를 AI 음성 트레이닝용 데이터 수집에 이용한 게 아니냐는 의혹의 눈초리를 보내고 있다.
그는 초보자에게는 절호의 기회로 보일 수 있지만 10분짜리 음성 샘플을 요구받는다는 사실에 주의하라며 당신의 목소리 클론이 만들어져 모르는 사이 수 시간 분량 콘텐츠로 재작성될 가능성이 있다고 지적했다. 또 숨겨진 조건이 있을 수도 있다며 어디까지나 사견이지만 신중하게 행동하라면서 이메일로 의뢰를 받은 게 아니라면 계약 조건을 잘 읽어봐야 하며 권리를 지키기 위한 것이며 AI 복제본은 성우에게 진정한 위협이라며 주의를 환기시켰다.
콘테스트에 20개 이상 음성 샘플을 제출했다는 마노하르 라오는 확실히 자신의 음성 샘플 속 다양한 표현, 억양, 감정이 그들의 손에 넘어갔을지도 모른다는 점에서 어딘가 걱정되는 부분이 있다고 말했다.
한편 포켓FM은 지적받은 조항을 삭제한 뒤 모든 음성 샘플은 참고용으로만 사용하며 복제 또는 상업적 목적으로 사용은 하지 않는다고 밝혔다.
포켓FM과 제휴한 일레븐랩스 측 관계자는 포켓FM과는 콘테스트 관련 음성 샘플이나 데이터 교환을 하지 않았으며 AI 트레이닝은 일레븐랩스 음성 라이브러리 데이터로 진행한 것이라고 설명했다. 일레븐랩스 라이브러리에는 커뮤니티에서 수집한 수천 개 텍스트를 음성으로 변환하는 데 적합한 29개 언어 음성 데이터가 있다고 한다. 관련 내용은 이곳에서 확인할 수 있다.