테크레시피

사진 1장·음성만으로 딥페이크 영상을…

삼성전자와 임페리얼칼리지런던 AI 연구팀이 사진 1장과 음성 데이터만으로 사람이 말하는 영상을 만들어내는 기술을 개발했다.

딥페이크는 기계학습을 통해 대량 훈련 데이터를 학습해 영상을 기존 영상과 합쳐 가짜 영상을 만들어내는 걸 말한다. 이번 연구에서도 기계학습 기술을 이용했다. 사진 1장으로 만들어낸 딥페이크가 100% 현실감이 있는 건 아니지만 완성도는 놀라운 수준이다.

예를 들어 알버트 아인슈타인의 사진과 강의 음성을 겹쳐 실제로 이뤄지지 않은 강의 영상을 만들어내는 것도 가능하다. 라스푸틴 영상에 비욘세의 헤일로(Halo) 같은 걸 노래하게 할 수도 있다. 또 감정 표현을 더하기도 한다.

이런 걸 보면 딥페이크 기술은 무서운 속도로 발전하고 있어 일반인도 쉽게 딥페이크를 만들 수 있는 소프트웨어가 등장하는 것도 시간 문제라고 할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독