테크레시피

위키피디아, 언어 장벽 극복 프로젝트 시작한다

애브스트랙트 위키피디아(Abstract Wikipedia)는 온라인 백과사전 위키피디아를 운영하는 위키미디어재단이 새로 진행하는 프로젝트다. 이사회 만장일치로 승인했다고 발표한 이 프로젝트가 진행되면 위키피디아 정보를 더 많은 언어로 공유할 수 있게 된다.

애브스트랙트 위키피디아는 지난 5월 위키피디아 공동 설립자 중 1명(Denny Vrandečić)이 제안한 프로젝트다. 위키미디어재단 입장에선 7년 만의 대형 프로젝트이기도 하다. 목표는 더 많은 사람이 더 많은 지식을 더 많은 언어로 공유할 수 있도록 하는 것. 구체적으론 위키 데이터를 확장하고 위키피디아에 적용해 언어에 의존하지 않는 방법으로 위키피디아 문서를 작성하거나 관리하는 걸 목표로 한다.

위키피디아 문서를 열면 영어를 비롯한 최대 171개 언어 버전 페이지에 대한 링크가 게재되어 있다. 언어별 페이지는 위키 프로젝트 자발적 참여자가 작성하거나 번역한 것이다. 하지만 위키피디아는 백과사전이라는 특성상 언어에 크게 의존하기 때문에 특정 언어 버전에서 얻을 수 있는 정보가 다른 언어 버전에선 얻을 수 없는 문제가 발생한다. 또 번역했더라도 제대로 번역된다고는 할 수 없다는 문제도 있다.

2016년 시작된 위키 데이터는 위키미디어재단이 제공하는 공동 데이터베이스다. 시작 초기부터 언어간 링크 일원화가 콘셉트. 위키 데이터는 기본적으론 매개변수에 대해 값을 주는 형태로 정보가 포함된 항목별 아이디로 공유하게 식별한다. 예를 들어 17세기 음악가 바흐에 대한 페이지에는 Q1339라는 아이디를 부여하고 여러 언어로 이 페이지를 공유할 수 있다.

바흐 위키데이터 페이지를 보면 사망일, 사망 장소, 사망 상황, 사인, 매장 위치 등 항목에 각각 값이 설정되어 있다. 다시 말해 바흐는 1750년 7월 28일 라이프치히에서 뇌졸중에 의해 병사해 세인트토머스교회에 묻혔다는 정보를 특정 언어 문법을 사용하지 않고 표현하고 있는 것이다. 여기에서 교회(St. Thomas Church)를 클릭하면 해당 위키 데이터 페이지로 이동한다. 이곳에는 Q170402라는 아이디를 붙였다.

위키데이터에서 사용하는 방법으로 위키피디아 콘텐츠 기초가 되는 부분을 기술하게 되는데 위키 언어 독립적 모델로 어떤 언어로도 보편적 가치를 갖는 문서 모델을 만들 수 있다고 기대하고 있다. 위키미디어재단 측은 자원봉사자가 이런 추상적 문서를 프로그램을 이용해 자신의 언어로 번역할 수 있다며 잘하면 사람이 위키데이터를 이용해 작성한 문서를 자신의 언어로 읽을 수 있게 될 것이라고 밝히고 있다.

물론 애브스트랙트 위키피디아가 발전을 하려면 더 많은 협력과 소프트웨어 개발이 필요하다. 재단 측은 애브스트랙트 위키피디아가 어디까지나 실험적 프로젝트라면서 지식의 공정성을 추진할 수 있다는 점에 기쁘게 생각하며 이 프로젝트는 지식을 어떻게 그리고 누구와 구축할 것인지에 대한 중요한 물음을 제공한다고 밝혔다. 이런 물음에 대해 커뮤니티와 함께 숙고할 걸 기대한다는 것이다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독