테크레시피

데이터 비익명화 가능하게? 허술한 美 마이데이터 기업

미국 마이데이터 기업인 요들리(Yodlee)가 미국 내 100만명 분량에 이르는 방대한 은행 데이터와 신용카드 거래 데이터를 익명화하지 않고 보유하고 있었다고 한다. 보도에선 내부 문서에 따르면 요들리 고객은 거대한 텍스트 파일을 다운로드하기 위해 찾을 경우 익명을 해제해버릴 수 있다는 것.

2019년 내부 문건에선 요들리가 어떻게 은행이나 신용카드 기업 등 파트너 데이터를 모았는지 설명하고 있다. 데이터에는 은행이나 신용카드 소유자 관련 식별자, 거래횟수, 구입일자, 거래를 한 매장, 기타 메타 데이터 등이 포함되어 있었다고 한다. 또 배달 앱을 통한 레스토랑 주문 등 여러 소매업체 관련 데이터도 있다. 요들리 고객이 데이터에 액세스하면 요들리가 운영하는 인터페이스가 아니라 텍스트 파일 형태로 다운로드된다는 것.

또 내부 문건에선 요들리가 텍스트 파일을 만드는 데이터 정리 구조도 설명하고 있다. 계정 번호와 전화번호, 사회보장번호 등을 XXX 문자로 숨기는 걸 말한다. 데이터 클리닝을 할 때에는 동시에 금융 거래 데이터와 급여, 은행이나 신용카드 회사명을 숨기도록 할 수 있다.

하지만 데이터 클리닝은 계정마다 할당된 식별자를 그대로 버리는 것이다. 익명화된 데이터에도 리버스 엔지니어링으로 개인을 특정할 수 있으며 일반 정보가 없어도 의외로 간단하다는 건 여러 차례 연구에서 지적되고 있다.

전문가들에 따르면 특정인이 뭔가를 구입한 정보가 확인되면 동일 식별자를 이용해 다른 거래 데이터도 비익명화할 수 있다는 설명이다. 예를 들어 3개나 4개 구매 내역에 대해 시간과 장소를 알아낼 수 있다면 공격자는 높은 확률로 계정을 비익명화할 수 있다는 것. 또 비익명화해 개인의 다른 거래 데이터도 손에 넣을 수 있게 된다.

한 전문가는 요들리의 데이터 클리닝은 데이터를 가명으로 재작성할 뿐이기 때문에 데이터세트를 손에 넣으면 나머지는 당신이 언제 어느 매장에서 구입했는지만 알면 당싱의 데이털르 식별할 수 있을 것이라고 지적한다.

요들리와 모기업인 엔베스트넷(Envestnet)은 개인 재무 데이터 익명화에 의해 소비자 프라이버시는 지켜지고 있다고 밝히고 있다. 하지만 연구자들은 몇 년에 걸쳐 익명화되어 있다는 데이터가 몇 가지 정보를 바탕으로 비익명화될 수 있다고 설명한다. 전문가들은 소비자가 엔베스트넷이 자신들의 정보를 얼마나 위험에 노출시켜왔는지 이해하지 못하고 있다면서 이 같은 우려는 엔베스트넷이 은행이나 신용카드 기업에 이런 일이 이뤄지는 걸 소비자에게 고지하도록 의무화하고 있지 않기 때문이라고 말한다. 관련 내용은 이곳에서 확인할 수 있다.