사진 1장·음성만으로 딥페이크 영상을…

이석원 기자

2019.07.11

삼성전자와 임페리얼칼리지런던 AI 연구팀이 사진 1장과 음성 데이터만으로 사람이 말하는 영상을 만들어내는 기술을 개발했다.

딥페이크는 기계학습을 통해 대량 훈련 데이터를 학습해 영상을 기존 영상과 합쳐 가짜 영상을 만들어내는 걸 말한다. 이번 연구에서도 기계학습 기술을 이용했다. 사진 1장으로 만들어낸 딥페이크가 100% 현실감이 있는 건 아니지만 완성도는 놀라운 수준이다.

Loading video

예를 들어 알버트 아인슈타인의 사진과 강의 음성을 겹쳐 실제로 이뤄지지 않은 강의 영상을 만들어내는 것도 가능하다. 라스푸틴 영상에 비욘세의 헤일로(Halo) 같은 걸 노래하게 할 수도 있다. 또 감정 표현을 더하기도 한다.

이런 걸 보면 딥페이크 기술은 무서운 속도로 발전하고 있어 일반인도 쉽게 딥페이크를 만들 수 있는 소프트웨어가 등장하는 것도 시간 문제라고 할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.