테크레시피

STT‧TTS 모델 개발하는 오픈소스 기업

코키(Coqui)는 수록한 음성을 그대로 텍스트로 자동화해주는 STT(Speech to Text) 음성 텍스트 변환 모델이나 입력한 텍스트를 자동으로 음성으로 읽어주는 TTS(Text to Speech) 모델을 오픈소스로 개발하는 기업이다.

코키 창업자는 원래 파이어폭스와 썬더버드 개발로 알려진 모질라 출신이다. 창업자는 음성 기술이 대기업에 의해 독점되어 오픈소스로 제공되지 않을지 모른다고 보고 독자 기업을 시작하고 오픈소스 음성 인식 엔진을 구축했다고 한다.

코키 STT 모델인 코키 STT 저장소는 깃허브에 호스팅된다. 코키 SST 특징은 미리 음성 라이브러리가 준비되어 있는 게 아니라 미리 녹음한 음성을 읽어내는 것으로 해당 음성으로 읽을 수 있다는 것이다.

코키 STT는 영어와 독일어, 불어 등 이용자가 많은 언어는 물론 소수 언어까지 80종류 이상 언어에 최적화되어 있으며 다운로드가 가능하다.

TTS 모델인 코키 TTS도 마찬가지이며 앞으로 공식 사이트를 통해 다운로드를 가능하게 할 예정이다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사