테크레시피

턱 카메라로 발성 인식한다?

스피친(SpeeChin)은 코넬대학 연구자가 연구하고 있는 목에 달린 카메라다. 매달린 카메라는 상향 그러니까 턱 쪽을 향하고 있다. 소리를 내지 않고도 입을 움직일 때 턱 움직임을 읽어 들여 발성을 읽어낸다.

카메라로 얼굴을 찍어 입 움직임을 읽는 것과 다른 건 아래에서 턱 움직임을 읽기 때문에 얼굴을 캡처하지 않고도 프라이버시를 배려할 수 있다는 것이다.

스피친 실험에는 20명이 참가했다. 10명은 영어로 54개 간단한 어구를 시험하고 나머지 10명은 중국어로 44개 어구를 실험했다. 그 결과 훈련 기간을 거쳐 스피친 정확도는 영어 90.5%, 중국어 91.6%까지 높아졌다. 다만 앉아서 가만히 있을 때 정밀도이며 걷거나 동작이 더해지면 스피친 정확도는 현저하게 떨어진다고 한다. 아직 연구는 초기 단계지만 어쩌면 시리나 알렉사보다 더 편리한 도구가 만들어질지도 모른다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사