테크레시피

이미지 생성 AI 추적 가능한 전자 워터마크 기술

이미지에 워터마크를 넣는다고 하면 인간이 만든 콘텐츠 전재나 악용을 막기 위한 걸로 인식하는 사람이 많을 수 있다. 하지만 최근에는 AI가 생성한 콘텐츠에 워터마크를 넣어 귀속 여부를 나타내는 시도도 진행되고 있다. 새롭게 메릴랜드대학 연구팀이 AI가 생성한 이미지를 추적 가능하게 하는 트리링 워터마크(Tree-Ring Watermarks)라는 기술을 발표했다.

최근에는 스테이블 디퓨전과 미드저니 같은 고품질 이미지 생성 AI가 잇따라 등장하고 있으며 누구나 쉽게 텍스트에서 다양한 이미지를 생성할 수 있다. 이와 동시에 문제가 된 건 누군가가 악의를 갖고 가짜 이미지를 생성하고 사람을 속이기 쉬워졌다는 점이다. 물론 기존 이미지 가공 소프트웨어에서도 정교한 가짜 이미지를 만들 수는 있지만 텍스트를 입력하는 것만으로 이미지를 생성할 수 있는 도구 등장은 장애물을 크게 낮춘다고 할 수 있다.

이 문제에 대처하기 위해 제창되는 게 AI가 생성한 이미지에 전자 워터마크를 넣어 식별 가능하게 하는 구조다. 전자 워터마크는 인간이 봐도 모르는 특수한 조작을 하는 것으로 검출 가능한 마이크이며 이 이미지는 AI로 생성됐다는 걸 식별하는데 도움이 된다. AI 생성 이미지에 전자 워터마크를 넣는 견고한 구조가 구축, 보급되면 소셜미디어나 보도기관, AI 플랫폼 등이 이미지 출처를 특정해 가짜 이미지에 의한 피해 경감이나 법 집행 기관에 대한 정보 제공이 가능하다.

기존 전자 워터마크는 파일이 출력된 뒤 워터마크를 추가하는 기법이 보통이다. 이에 대해 연구팀은 AI가 이미지를 생성하는 프로세스 자체에 전자 워터마크 시스템을 통합하는 트리링 워터마크를 고안했다. 확산 모델(diffusion model)을 채택한 스테이블 디퓨전 같은 이미지 생성 AI에선 초기값인 랜덤 노이즈 이미지로부터 서서히 노이즈를 제거하며 최종적으로 깨끗한 이미지를 생성한다. 트리링 워터마크는 이런 이미지 생성 과정 중 초기값인 랜덤 노이즈 배열에 푸리에 변환에 근거해 구축된 패턴인 키를 포함한다. 이 키는 표준 생성 절차를 거쳐 무작위 노이즈가 깨끗한 이미지로 변환되어도 잠재적 레이아웃에 작은 변화로 남아 있지만 인간이 검사해도 다른 무작위 생성 이미지와 구별할 수 없다.

하지만 키가 내장된 이미지를 확산 모델에서 역방향으로 처리해 원래 랜덤 노이즈를 복원하면 키가 존재하는지 확인할 수 있다. 키는 푸리에 변환에 새겨진 패턴이기 때문에 트리밍이나 색 변경, 반전, 회전, 노이즈 추가 등 편집에 대해서도 기존 방법보다 훨씬 견고하다는 설명이다.

실제로 연구팀은 검증 테스트를 통해 이미지 품질 점수 영향이 무시할 수준이라는 것, 변환에 대한 높은 신뢰성, 검출에 있어 낮은 위양성률 등을 확인했다고 한다.

디지털 콘텐츠에 넣는 전자 워터마크에선 일반 사용자가 봐도 눈치 채지 않을 것, 악의적 인물이 파일을 가공해도 잃어버리지 않는 것 등 조건이 요구된다. 트리링 워터마크는 이런 요구 사항을 충족하고 있으며 AI 생성 이미지 출처를 추적하는데 도움이 될 것으로 기대되고 있다. 트리링 워터마크 구현에서 새로운 이미지 생성 AI를 만들 필요는 없고 API를 통해 기존 이미지 생성 AI에 추가할 수 있다고 한다. 확산 모델 반전 처리를 실행하려면 AI 모델 파라미터가 필요하기 때문에 검증할 수 있는 건 설계상 AI 모델 소유자 뿐이라고 한다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독