테크레시피

3D 객체 만들어주는 생성형 AI

메쉬GPT(MeshGPT)는 대규모 언어 모델이 언어를 구사하는 구조를 이용해 3D 객체를 생성하는 AI다.

대규모 언어 모델은 언어를 말하는 것 외에 학습에 따라선 프로그래밍 언어를 말하는 것도 가능하다. 따라서 연구팀은 모델에 대해 3D 객체 구성 요소인 메쉬를 말할 수 있도록 학습을 실시했다. 먼저 다양한 3D 오브젝트 데이터를 바탕으로 메쉬 어휘를 배우게 하고 학습한 어휘를 바탕으로 트랜스포머를 학습하고 있다.

어휘 학습 구조는 신경망이 메쉬 제오메트리와 토플로지 정보를 처리할 수 있도록 한다. 어휘 학습 이후 대규모 언어 모델이 단어와 단어 연결을 기억하게 하듯 트랜스포머가 메쉬와 메쉬간 연결을 기억하게 한다. 대규모 언어 모델이 문장 연속을 쓸 수 있는 것처럼 메쉬GPT는 모델 일부를 바탕으로 나머지 부분을 완성시킬 수 있다.

메쉬GPT는 다른 기법보다 정점 수가 너무 많거나 너무 적지 않고 적당한 디테일이 있는 모델을 생성할 수 있다고 한다. 연구팀에 따르면 제품 품질을 나타내는 FID 점수가 30%, 형상 커버리지 9% 증가 등 메쉬GPT가 메쉬 생성을 크게 개선해줬다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독

Most popular