논문‧서적 요약해 팟캐스트로 자동 변환해주는 AI

구글은 AI가 논문이나 서적을 요약한 뒤 그 내용을 바탕으로 대화 형식 음성 콘텐츠를 생성하는 구글 일루미네이트(Google Illuminate)에서 생성된 음성 미리 듣기 기능을 공개했다. 현재 구글 일루미네이트는 실험적인 데모로서 공개되어 있으며 실제로 논문을 음성으로 변환한 결과를 웹사이트에서 들을 수 있다.

현재 컴퓨터 과학 분야 학술 논문이 예시로 제시되어 있다. 재생 버튼을 클릭하면 실제로 생성된 음성을 들을 수 있다. 구글 연구진이 2006년 트랜스포머(Transformer) 모델을 발표한 논문(Attention is All You Need) 음성을 재생한 결과 이 논문 핵심 아이디어는 무엇이냐는 질문에 대해 리커런트나 합성곱(convolution)을 사용하지 않고 대신 어텐션 메커니즘을 사용해 효율적인 시퀀스 변환 모델을 만들 수 있다는 것이며 기계 번역 맥락에서 이 새로운 접근 방식은 RNN보다 성능이 향상될 뿐 아니라 훈련도 더 빠르게 진행할 수 있다고 남녀 2명이 논문 내용을 설명하는 영어 음성이 재생된다.

브라우저 하단에는 플레이어가 표시되고 남녀 2명이 논문 내용을 설명하는 영어 음성이 재생된다. 플레이어에는 생성된 음성을 평가할 수 있는 피드백 및 플래그 버튼이 있다.

뷰 소스(View Source)를 클릭하면 논문에 대한 링크, 생성된 음성 길이, 생성 날짜가 표시된다.

구글은 구글 일루미네이트는 실험적인 제품이기 때문에 두 사람이 대화하는 형식 AI 생성 음성은 원본 연구 논문 뉘앙스를 완전히 포착하지 못할 수도 있다며 때때로 오류나 불일치가 발생할 수 있으며 사용자 경험을 개선하기 위해 지속적으로 개선하고 있다는 점을 양해 바란다고 설명했다.

구글 일루미네이트를 이용하려면 버튼(Sign in to join waitlist)을 눌러 구글 계정으로 로그인한 뒤 대기자 명단에 등록해야 한다. 보도에선 학술 논문에 대한 접근성이 높아지고 흥미로운 논문을 확인하고 싶은 이들에게 유용할 것이라며 긍정적인 의견이 있었고 정말 멋진 아이디어로 다운로드는 했지만 읽을 기회가 없던 논문을 학습하는 데 완벽한 방법이라는 반응도 있었다. 반면 몇 분 이상은 듣기 힘들었다며 여느 때와 마찬가지로 대규모 언어 모델이 생성한 지루한 내용이었다거나 생성 AI 부정확함으로 인해 곧 실패할 것이며 3년 내에 구글이 서비스를 종료할 것 같다, 실제 인간 대화처럼 들리기 때문에 대규모 언어 모델이 일으킬 수 있는 오류나 논문 속 잘못된 부분을 강조하는 경우가 문제라는 부정적인 의견도 있었다. 또 애플 팟캐스트 상위 목록을 보면 의도적으로 거짓말을 하거나 정보를 조작하는 인간이 많기 때문에 컴퓨터가 생성한 거짓말에 대해서는 크게 걱정할 필요가 없을 것이라는 풍자적인 의견도 있었다. 관련 내용은 이곳에서 확인할 수 있다.