테크레시피

“다른 사람 목소리로…” 메타가 개발한 음성 생성 AI

페이스북이나 인스타그램 운영사로 AI 연구에도 힘을 쏟고 있는 메타가 음성 생성 AI인 보이스박스(Voicebox)를 6월 16일 발표했다. 보이스박스를 이용하면 입력 문장을 읽게 할 뿐 아니라 음성 일부를 편집하거나 다른 사람 목소리로 문장을 마음대로 읽게 하는 등 악용될 것 같은 조작도 가능하다. 메타는 보이스박스가 악용될 가능성을 인정하고 있으며 보이스박스 모델 데이터와 코드 공개를 앞두고 있다.

보이스박스는 입력 문장을 자연스러운 목소리로 읽을 수 있고 타인 목소리를 녹음해 입력 문장을 읽게 하고 타인 목소리를 녹음하고 입력한 문장을 지정한 억양으로 읽게 하고 타인 목소리를 녹음해 일부를 편집하는 것 같은 조작이 가능한 음성 생성 AI다.

다른 사람 목소리를 녹음해 일부 편집하는 기능 데모도 공개되어 있다. 데모를 재생하면 어디에서 편집한 부분인지 판별할 수 없을 만큼 고정밀 편집이 가능하다는 걸 알 수 있다. 더구나 타인 음성을 3초 가량 녹음하는 것만으로 장문을 읽게 하는 것도 가능하다. 트윗 같은 짧은 음성을 녹음하는 것만으로 자유롭게 문장을 읽을 수도 있다.

보이스박스 각종 데모를 확인하면 다른 사람 목소리로 문장을 마음대로 읽게 하는 조작을 높은 정밀도로 실행할 수 있기 때문에 악용 위험성도 높다는 걸 알 수 있다. 메타는 보이스박스가 악용될 위험성을 인정하고 있으며 보이스박스 학습 모델과 코드 공개를 삼가고 있다. 하지만 메타 측은 진짜 음성과 보이스박스에서 생성한 음성을 구별하기 위한 효과적인 시스템도 개발했다고 밝혀 미래에는 진짜 음성과 AI 생성 음성을 구별하는 구조가 구축될 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사