테크레시피

MS, 기계 번역에 마오리어 추가한 이유

기계 번역은 누구나 이용할 수 있지만 실제 응용 프로그램은 기술이 제공하는 가치 중 일부에 불과하다. 마이크로소프트는 뉴질랜드 정부와 함께 마오리어를 추가해 기계 번역의 유용성을 높이려 한다.

마오리어(Te reo Māori)는 뉴질랜드 최대 원주민인 마오리족이 이용하는 언어다. 하지만 어디에서나 그렇듯 마오리도 여러 세대에 걸쳐 식민지인의 지배적 문화에 동화되면서 언어는 점차 잊혀질 수 있다.

마오리족은 전체 인구 중 15%를 차지하지만 마오리어로 얘기하는 사람은 4분의 1에 불과하다. 뉴질랜드 전체 인구 중 3%에 불과한 것. 뉴질랜드 당국은 마오리 교육을 폭넓게 추진해 이 같은 추세를 뒤집고 적절한 보존을 위한 대책을 강구하고 있다.

마이크로소프트와 뉴질랜드 마오리위원회(Te Taura Whiri i te Reo Māori)는 몇 년간 협력해 자사의 소프트웨어에 사라져가는 언어를 포함할 수 있게 노력하고 있다. 이런 일환으로 마이크로소프트 번역 서비스에 마오리족 언어 도입을 하려는 것. 이 서비스를 지원하면 다른 60개 언어와 마오리어 사이에 자동 번역이 이뤄진다.

자동 번역은 이해를 돕고 묻혀 있던 언어를 탐구할 수 있도록 해주는 만큼 교육에도 강력한 힘이 될 수 있다. 정확한 번역 모델 생성은 어떤 언어도 어렵다. 열쇠는 서로 비교할 수 있는 말뭉치를 많이 준비하는 것이다. 따라서 개발에 중요한 말뭉치를 위원회가 모으고 품질 검사를 수행해 올바른 번역을 할 수 있게 해준다. 하지만 언어를 아는 사람이 적으면 불어나 독일어 번역 서비스를 만들 때보다 이 같은 작업은 훨씬 더 어렵다.

Maori language und mask

한 전문가는 마오리 도구 개발은 오랜 공동 목표를 향해 노력하는 수많은 사람의 노력 없이는 불가능했을 것이라면서 뉴질랜드의 미래 세대를 위해 마오리족 언어를 정상화하고 마오리어가 전 세계에 공유되는 가치를 인정받게 되기를 바란다고 밝혔다. 기술이 문화 전통에 반영되는 걸 강화해주는 역할을 해주는 중요성도 강조했다.

전 세계에서 수많은 언어가 죽어가고 있다. 이를 모두 막을 수는 없겠지만 기술이 기록과 사용을 도와 현용 언어와 공존시켜 나가는 건 가능할 수 있다. 마오리어 번역 사업은 마이크로소프트의 문화 계승을 위한 AI사업(AI for Cultural Heritage) 일환으로 진행하는 것이다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독