
노타젠(NotaGen)은 중국을 중심으로 하는 연구팀이 개발한 클래식 음악 생성 AI 모델이다. 노타젠은 160만 건에 이르는 음악 데이터로 훈련됐으며 작풍을 지정해 음성 데이터와 악보 데이터를 생성할 수 있다.
관악기, 현악기, 타악기로 구성된 풀 오케스트라 편성곡도 생성할 수 있다. 피아노 반주가 있는 4부 혼성 합창곡도 생성 가능하다.
노타젠은 대규모 언어 모델(LLM) 훈련에 사용되는 심층 학습 모델인 트랜스포머를 활용해 훈련됐다. 학습 데이터는 음악 데이터 160만 건을 포함하며 작곡가 152명이 작곡한 고품질 클래식 음악 악보 데이터 8,948곡으로 미세 조정됐다.
노타젠 모델 데이터는 허깅페이스 웹사이트에 공개되어 있으며 ComfyUI에서 사용할 수 있는 커스텀 노드도 배포됐다. 웹브라우저에서 작동하는 데모 애플리케이션도 공개됐다. 관련 내용은 이곳에서 확인할 수 있다.