문장이나 이미지를 자동 생성하는 AI인 노벨AI(NovelAI)에 이용되고 있는 출력하는 이미지 품질을 크게 높여주는 도구(Aspect Ratio Bucketing)가 오픈소스 소프트웨어 라이선스인 MIT 라이선스로 공개됐다. 이 기술은 이미지 생성 AI 문제로 인식된 부자연스럽게 잘라낸 이미지가 생성되는 문제를 해결하기 위한 것이다.
기존 이미지 생성 모델이 안고 있는 문제 중 하나는 정사각형 이미지를 생성, 출력하도록 학습되고 있는데 학습원이 되는 사진이나 아트워크, 미술 작품은 정사각형이 아닌 게 많다는 것이다. 이미지 생성 모델을 학습할 때에는 GPU 효율 최적화를 위해 한 번에 여러 학습 샘플을 조작하는 게 일반적이다. 이 때문에 타협안으로 정사각형이 아닌 이미지는 중앙을 정사각형으로 잘라 훈련에 이용되어 왔다. 이럴 때에는 학습할 때 잘려나가는 문제가 생긴다.
해결책으로 생각되는 것 중 하나는 고정 크기 캔버스에 이미지가 들어다도록 붙여 넣고 불필요한 부분은 마스크를 거는 것이지만 학습할 때 불필요한 계산이 발생하게 된다.
이 때문에 필요한 게 이 기술(Aspect Ratio Bucketing)이다. 이 방법은 데이터세트 이미지를 기반으로 256×256, 320×1024, 384×1024, 384×960, 512×512처럼 복수 버킷을 준비해 이미지를 가장 가까운 버킷에 할당해 각 버킷을 치우침 없이 학습한다는 것이다. 관련 내용은 이곳에서 확인할 수 있다.