삼성전자와 임페리얼칼리지런던 AI 연구팀이 사진 1장과 음성 데이터만으로 사람이 말하는 영상을 만들어내는 기술을 개발했다.
딥페이크는 기계학습을 통해 대량 훈련 데이터를 학습해 영상을 기존 영상과 합쳐 가짜 영상을 만들어내는 걸 말한다. 이번 연구에서도 기계학습 기술을 이용했다. 사진 1장으로 만들어낸 딥페이크가 100% 현실감이 있는 건 아니지만 완성도는 놀라운 수준이다.
예를 들어 알버트 아인슈타인의 사진과 강의 음성을 겹쳐 실제로 이뤄지지 않은 강의 영상을 만들어내는 것도 가능하다. 라스푸틴 영상에 비욘세의 헤일로(Halo) 같은 걸 노래하게 할 수도 있다. 또 감정 표현을 더하기도 한다.
이런 걸 보면 딥페이크 기술은 무서운 속도로 발전하고 있어 일반인도 쉽게 딥페이크를 만들 수 있는 소프트웨어가 등장하는 것도 시간 문제라고 할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.