테크레시피

얀덱스, 일부 검색어 치면 푸틴 나오지 않게 처리

지난 1월초 러시아판 구글로 불리는 러시아 최대 검색엔진인 얀덱스(Yandex)에서 소스 코드가 유출됐다. 이 코드 해석으로 얀덱스는 대머리나 거짓말쟁이라고 검색하면 블라디미르 푸틴 대통령 이미지가 표시되지 않게 하거나 Z라고 검색해도 나치 독일 관련 검색 결과가 표시되지 않게 했던 게 알려졌다.

얀덱스 소스 코드 유출은 해킹 같은 공격이 아니라 정치적 동기를 지닌 전직 얀덱스 직원이 깃 저장소를 훔쳐 공개하면서 발생했다. 얀덱스에서 유출된 파일은 44.7GB에 이르기 때문에 분석에는 시간이 걸리지만 현 단계에서도 얀덱스나 인적 교류가 활발한 구글 검색 엔진에 대해 많은 지견을 얻을 수 있다.

예를 들어 당초 1922개로 여겨지던 랭킹 요소는 극히 일부에 지나지 않고 실제로는 1만 7,854개에 이르는 랭킹 요소가 있었다고 한다. 그 중에는 NEWS_AGENCY_RATING라는 얀덱스가 특정 보도기관을 유리하게 하기 위해 사용한 변수도 있었다. 이 발견은 비슷한 류를 랭킹 시스템에 도입하는 걸 단호하게 표명해온 구글과는 크게 다른 점이라는 지적이다.

더구나 러시아 당국으로부터 바람직하지 않은 조직으로 인정되는 러시아어 뉴스 사이트에 따르면 얀덱스가 푸틴 대통령을 불편한 검색어와 연관되지 않게 하고 있었다고 한다. 얀덱스에 의한 검색 쿼리 자동 수정은 주로 성적 이미지나 영상을 삭제하는 데 목적을 두고 있었지만 이 구조는 특정 검색어로부터 푸틴 대통령 이미지를 출력하지 않게 하는 용도에도 사용됐다고 한다. 거짓말쟁이나 대머리, 도둑 등을 비롯한 것이며 나치즘 관련한 것도 마찬가지다. Z는 러시아어로는 사용되지 않는 문자지만 지난해 2월 우크라이나 침공 이후에는 전쟁 상징으로 이용되고 있다.

얀덱스 측은 소스 코드 유출에 대해 유출 코드는 자사 서비스에서 현재 사용되는 버전과는 달리 공개된 일부는 실제로 이용되지 않는다고 밝혔다고 한다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독

Most popular