트위터 모기업인 엑스(X)가 7월 6일 트위터 사용자 데이터를 스크래핑해 손해를 줬다며 익명 개인 4명에 소송했다. 엑스는 텍사스주 댈러스 연방지방법원에 제출한 소장에서 텍사스주 주민과 관련된 데이터를 불법 스크래핑했다고 주장하며 피고에 대해 100만 달러 이상 손해배상을 요구하고 있다.
소장에선 익명 개인을 가리키는 명칭(John Doe) 1∼4로 표기된 익명 인물 4명으로 표현하고 있다. 이들 4명은 IP 주소로만 식별되며 트위터 이용 약관 위반으로 사용자 데이터를 불법 스크래핑했다고 한다. 데이터 스크래핑은 자동화된 프로그램을 통해 공개적으로 액세스할 수 있는 웹사이트에서 데이터를 수집하는 행위다. 수집 데이터는 대규모 언어 모델 교육과 온라인 광고 타깃팅 등 다양한 용도로 사용할 수 있다.
엑스는 스크래핑은 수백만 개 요청으로 서버 처리 능력을 저하시키고 실제 사용자 이용 경험을 해치면서 트위터 웹사이트나 모바일앱에 대한 정당한 운영을 방해한다며 데이터 스크래핑을 하는 기업이 개인 정보를 재패키징하고 판매하는 방법을 제어할 수 있다면서 위법에 데이터를 스크래핑해 피고는 엑스 이용 약관 뿐 아니라 트위터 사용자 개인 정보 보호 설정도 분명히 무시하고 있다고 주장했다.
엑스는 트위터에서의 부정한 데이터 스크래핑을 막기 위한 조치를 강구하고 있으며 이 중 하나가 7월초 발생한 트윗 열람 제한이라는 것. 일론 머스크는 소송에 대해 보도한 트윗에 대해 일부 조직이 단기간에 지금까지 이뤄진 모든 트윗을 수집하려 했다고 밝혔다. 사전 에고 없이 제공된 트윗 브라우징 제한은 트위터에 큰 혼란을 일으켰고 많은 트위터 사용자가 옮겨갈 SNS를 찾기 시작했다. 이에 따라 메타는 인스타그램을 기반으로 한 트위터와 비슷한 스레드가 불과 하루 만에 신규 등록자수 3,000만 명을 넘어섰다.
최근 발생한 피고 일을 포함한 IP로부터의 요구는 서버에 심각한 부담을 끼치고 사용자 수백만 명이 경험을 해치는 결과가 되어 엑스에 손해를 줬다는 것이다. 엑스는 이런 데이터 스크래핑에 의해 얻은 이익이 부당하다고 주장하며 피고에 대해 100만 달러 이상 손해배상을 요구했다. 이번 소장은 댈러스 카운티 연방지방법원에 제출됐지만 이는 피고가 댈러스 카운티 데이터 처리업체와 계약하고 있었기 때문이라고 한다. 엑스는 더 많은 IP 주소를 데이터 스크래퍼로 식별하고 있기 때문에 다른 지역에서 활동하는 데이터 스크래퍼에 대해서도 유사한 소장이 제출될 가능성이 있다. 덧붙여 링크드인이 공개 데이터 스크래핑을 실시한 스타트업(hiQ Labs) 소송 재판에선 2022년 공적인 데이터 스크래핑은 법적으로 문제없다는 판결이 나온 바 있다. 관련 내용은 이곳에서 확인할 수 있다.