테크레시피

저비트레이트‧고음질 음성 코덱 발표한 메타

왓츠앱이나 메신저 등 실시간 통신(RTC) 앱을 개발하는 메타가 RTC 대상으로 저비트레이트이면서도 높은 음질을 목표로 한 오디오 코덱 MLow(Meta Low Bitrate)를 발표했다.

스마트폰 RTC 앱에서 음성통화를 할 때 중요한 건 코덱이다. 일반 통화에 캡처된 음성 비트레이트는 모노랄, 샘플링레이트 48kHz, 비트심도 16비트라면 768kbps다. 하지만 스마트폰에서 편안한 통화를 하려면 음성을 인코딩해 압축하고 비트레이트를 낮춰야 한다.

현재 RTC 앱에서 많이 사용되는 코덱은 오푸스(Opus)다. 2012년 출시된 오픈소스 코덱으로 무료로 5밀리초라는 낮은 지연시간을 실현하고 있다. 오푸스 코덱을 채택한 RTC 앱 여러 개를 개발한 메타에 따르면 실제 사용 상황에선 통신 일부에서 네트워크 접속이 불량해지는 경우가 있다고 한다. 네트워크 품질이 저하되면 네트워크 혼잡을 피하기 위해 앱이 자동으로 코덱 비트레이트를 낮추지만 이렇게 하면 음질이 떨어지게 된다. 최근에는 영상 통화도 일반화되어 네트워크 품질이 나쁘면 음성 데이터 대역폭이 좁아져 비트레이트가 더 낮아지는 경향이 있다. 실제로 네트워크 환경이 악화되어 오푸스로 6kbps 낮은 비트레이트로 인코딩된 음성과 원 음성을 비교하면 선명하고 자연스러운 음성에서 멀어진 품질임을 알 수 있다.

이에 따라 메타는 RTC를 위한 새로운 음성코덱으로 MLow를 개발했다. MLow는 오푸스보다 음성품질은 2배 뛰어나지만 계산 비용은 오푸스보다 10% 낮다고 한다.

MLow는 입력 음성을 저주파수 대역과 고주파수 대역으로 분할하고 각각을 개별적으로 인코딩한다. 각 대역은 공유정보를 활용해 압축 효율을 높이고 범위 인코더로 더 압축해 페이로드를 생성한다. 디코더는 그 반대 처리를 해 출력 오디오 신호를 생성한다.

메타에 따르면 이미 인스타그램과 메신저 통화 기능에 MLow를 완전 도입했고 왓츠앱에도 단계적 도입을 진행 중이라고 한다. 메타 측은 모든 사용자가 고품질 음성통화를 더 쉽게 할 수 있도록 노력하고 있으며 앞으로 더 많은 정보를 공유할 수 있기를 기대한다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독