테크레시피

아마존 오디오북 플랫폼 “AI 합성음성이 늘어나고 있다”

최근 AI 기술 발전으로 인해 AI를 사용한 합성 음성은 사람 목소리와 비교해도 손색없는 수준에 이르렀다. 아마존 오디오북 플랫폼인 오디블(Audible)에선 4만 권에 이르는 책 낭독이 AI 합성 음성으로 이뤄지고 있다고 보고됐다.

2023년 11월 아마존은 전자책이나 종이책을 자비 출판할 수 있는 서비스 KDP(Kindle Direct Publishing)를 이용하는 사용자에게 합성 음성을 사용한 오디오북 제작 도구를 제공하기 시작했다. 이 도구를 사용한 한 작가는 자신의 책을 오디오북으로 만드는 데 걸린 시간은 겨우 52분이었다고 보고했다. 어떤 작가는 내레이션을 인간이 아닌 AI에 맡기면 비용을 절감할 수 있어 권당 수백 달러에서 수천 달러를 절약할 수 있게 됐다고 언급하기도 했다.

이 도구 제공 개시 이후 5월까지 수개월 동안 만들어진 합성 음성 오디오북 수는 4만 권 이상에 다다랐다. 내레이터 표시란(Narrated by)에는 합성음성(Virtual Voice)이라고 적혀 있다.

하지만 일부 사용자는 오디블에서 합성음성이 사용된 오디오북을 제외할 수 없고 인간 내레이터 일자리를 빼앗으며 품질 저하로 이어질 것이라고 지적하고 있다. 한 사용자는 오디블에서 합성음성 오디오북을 발견해 너무 실망스러웠다며 고용되지 못할 인력을 생각해보라고 지적하기도 했다. 한 내레이터는 일자리를 빼앗긴 건 아니지만 점점 그렇게 되어가고 있다고 밝혔다.

한편 오디블 측은 합성음성 기능은 베타 버전일 뿐이며 이 베타를 통해 고객 여러분을 대신해 혁신을 계속하는 가운데 고객이 뭘 원하는지에 대해 더 배우고 있다며 합성음성이 사용된 오디오북 평균 총 평점은 5점 만점에 4점 이상으로 높은 평가를 받고 있다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독