테크레시피

STT‧TTS 모델 개발하는 오픈소스 기업

코키(Coqui)는 수록한 음성을 그대로 텍스트로 자동화해주는 STT(Speech to Text) 음성 텍스트 변환 모델이나 입력한 텍스트를 자동으로 음성으로 읽어주는 TTS(Text to Speech) 모델을 오픈소스로 개발하는 기업이다.

코키 창업자는 원래 파이어폭스와 썬더버드 개발로 알려진 모질라 출신이다. 창업자는 음성 기술이 대기업에 의해 독점되어 오픈소스로 제공되지 않을지 모른다고 보고 독자 기업을 시작하고 오픈소스 음성 인식 엔진을 구축했다고 한다.

코키 STT 모델인 코키 STT 저장소는 깃허브에 호스팅된다. 코키 SST 특징은 미리 음성 라이브러리가 준비되어 있는 게 아니라 미리 녹음한 음성을 읽어내는 것으로 해당 음성으로 읽을 수 있다는 것이다.

코키 STT는 영어와 독일어, 불어 등 이용자가 많은 언어는 물론 소수 언어까지 80종류 이상 언어에 최적화되어 있으며 다운로드가 가능하다.

TTS 모델인 코키 TTS도 마찬가지이며 앞으로 공식 사이트를 통해 다운로드를 가능하게 할 예정이다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독

Most popular