테크레시피

이미지 생성 AI 해상도 학습 돕는 MIT 라이선스 기술

문장이나 이미지를 자동 생성하는 AI인 노벨AI(NovelAI)에 이용되고 있는 출력하는 이미지 품질을 크게 높여주는 도구(Aspect Ratio Bucketing)가 오픈소스 소프트웨어 라이선스인 MIT 라이선스로 공개됐다. 이 기술은 이미지 생성 AI 문제로 인식된 부자연스럽게 잘라낸 이미지가 생성되는 문제를 해결하기 위한 것이다.

기존 이미지 생성 모델이 안고 있는 문제 중 하나는 정사각형 이미지를 생성, 출력하도록 학습되고 있는데 학습원이 되는 사진이나 아트워크, 미술 작품은 정사각형이 아닌 게 많다는 것이다. 이미지 생성 모델을 학습할 때에는 GPU 효율 최적화를 위해 한 번에 여러 학습 샘플을 조작하는 게 일반적이다. 이 때문에 타협안으로 정사각형이 아닌 이미지는 중앙을 정사각형으로 잘라 훈련에 이용되어 왔다. 이럴 때에는 학습할 때 잘려나가는 문제가 생긴다.

해결책으로 생각되는 것 중 하나는 고정 크기 캔버스에 이미지가 들어다도록 붙여 넣고 불필요한 부분은 마스크를 거는 것이지만 학습할 때 불필요한 계산이 발생하게 된다.

이 때문에 필요한 게 이 기술(Aspect Ratio Bucketing)이다. 이 방법은 데이터세트 이미지를 기반으로 256×256, 320×1024, 384×1024, 384×960, 512×512처럼 복수 버킷을 준비해 이미지를 가장 가까운 버킷에 할당해 각 버킷을 치우침 없이 학습한다는 것이다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사