테크레시피

일론 머스크 “트위터봇 5% 미만 입증 안 되면…”

일론 머스크가 지난 4월 26일 트위터 인수 성립 발표 이후 트위터 스팸 가짜 계정 비율과 트위터 안티 스팸 정책에 불만을 제기하고 인수 진행을 늦추는 취지 발언을 해 눈길을 끈다.

그는 5월 13일 스팸과 가짜 게정이 사용자 5% 미만이라는 트위터 측 입장을 뒷받침하는 데이터가 나올 때까지 트위터 인수를 일시적으로 보류하겠다는 트윗을 올렸다.

일론 머스크가 스팸과 가짜 계정에 대해 언급하자 트위터 CEO인 파라그 아그라왈은 자사 안티 스팸 정책에 대해 해설하는 트윗을 올렸지만 일론 머스크는 이모티콘으로 대답한 뒤 아그라왈의 트윗은 트위터가 요금을 지불해 광고를 전달하고 있는 광고주에 대해 불성실하다는 취지로 비판했다.

결과적으로 트위터 조사 결과와 아그라왈 설명을 들은 일론 머스크는 스팸과 가짜 계정 비율이 20%라는 조사 결과는 트위터가 주장하는 5%보다 4배이며 자신의 인수 제안은 트위터 SEC 파일링 그러니까 투자자를 위한 재무 등 공식 문서가 정확하다는 것을 기반으로 하기 때문에 트위터 CEO가 스팸‧가짜 계정은 5% 미만이라는 증거 공개를 거부한다면 인수 거래를 진전시킬 수 없다고 트윗했다.

일론 머스크는 440억 달러 인수액을 내리려는 것으로 보이지만 트위터는 2022년 5월 17일 SEC에 제출한 성명을 통해 합의한 가격과 조건으로 가능하면 빨리 거래를 완료할 걸 약속한다고 밝히고 있다.

또 트위터는 5월 12일 아그라왈 CEO 주도로 소비자 제품 리더와 수익 제품 책임자 2명을 해고했다. 관련 내용은 이곳에서 확인할 수 있다.

한편 그의 발언 이후 스파크토로(SparkToro)가 제공하는 페이크 팔로워(Fake Followers)라는 트위터 분석용 무료 도구를 이용해 트위터에 대한 조사를 실시했다. 하지만 스파크토로는 페이크 팔로워는 어디까지나 비공식 무료 조사를 지원하기 위한 도구이며 비즈니스용은 별도 조사 도구를 제공하고 있다고 밝혀 페이크 팔로워를 이용한 분석에는 조사 결과가 불충분하게 될 가능성을 우려하고 있다.

스파크토로는 팔로워원크(Followerwonk)와 공도응로 트위터에서 스팸과 가짜 계정 비율을 분석했다. 이번 조사에선 스팸과 가짜 계정은 정기적으로 인간 손으로 트윗 콘텐츠가 작성되거나 타임라인 상에서 액티비티가 확인되거나 트위터 생태계에 관여하는 것 같은 행동이 확인되지 않은 계정이라고 한다.

스파크토로에 따르면 가짜 계정 대부분은 악의적인 문제가 없는 계정이라고 한다. 가짜 계정 중 구체적인 예로는 웹사이트 게시물을 자동으로 트위터에 게시하는 것이나 구글맵에서 발견한 모든 레스토랑에 대해 트윗하는 계정 등이 있다. 이런 자동 게시형 트위터 계정은 트위터에 다수 존재하고 있어 사용자에게 의미 있는 계정이기 때문에 악의나 문제도 없다는 지적이다.

한편 스팸 계정은 선전이나 가짜 정보 날조, 피싱 사기, 멀웨어 배포, 주식이나 암호화폐 조작, 괴롭힘이나 협박 등에 이용되고 있어 사용자에게는 바람직하지 않은 성가신 존재다.

이번 조사에서 스팸과 가짜 게정은 비교적 보수적 해석에 치우쳐 기업 계정처럼 복수 인간에 의해 불규칙하게 운용되는 계정이나 반자동으로 운용되는 계정은 가짜 계정으로 분류되지 않았다.

이 조사에선 팔로워원크에 색인된 110억 4,700만 건 트위터 계정 중 9주간 1개 이상 트윗을 올리고 있는 조건을 충족하는 1억 3,000만 건 계정 중 랜덤으로 뽑은 4만 4,058건을 분석했다. 그 결과 활성 계정 중 8,555건 그러니까 19.42%가 스팸이나 가짜 계정으로 분류됐다. 스파크토로는 이 데이터는 트위터 활성 사용자 중 스팸이나 가짜 계정 비율을 보여주는 최상 데이터라고 설명하고 있다.

스파크토로는 또 자사 페이크팔로워가 수집한 50만 1,532개 트위터 계정 중 스팸이나 가짜 계정 비율을 분석한 결과 스팸과 가짜 계정 비율은 22.35%가 나왔다고 밝혔다. 또 일론 머스크 트위터 계정 팔로어 9,340만 건을 분석한 결과에 따르면 그의 트위터 계정 팔로워 중 6%가 스팸이나 가짜 계정이었다고 한다. 일론 머스크 계정을 팔로잉하고 있는 활성 계정 2,680만 건 중 스팸이나 가짜 계정 비율을 분석한 결과 이 비율은 23.42%로 나타났다. 또 일론 머스크 트위터 계정을 팔로우한 사용자 중 랜덤 100명을 추출해 스팸이나 가짜 계정 비율을 분석한 결과는 놀랍게도 70.23%가 나왔다고 한다.

스파크토로는 무작위 추출에서 스팸이나 가짜 계정 비율이 70%를 넘은 이유에 대해선 인기 높은 계정은 다른 계정보다 스팸이나 가짜 계정에 의한 팔로우가 많은 경향이 있으며 매스컴 보도나 공익 관련 계정은 다른 게정보다 더하다고 밝혔다. 또 일론 머스크 계정은 트위터가 새로운 사용자를 추천하는 계정이어서 스팸이나 가짜 계정에 의한 팔로우가 늘어나는 경향이 있다는 설명도 곁들였다.

스파크토로가 사용한 스팸 계정 특정 모델은 2018년 7월 회사가 구매한 스팸 계정 3만 5,000개와 비스팸 계정 5만 개를 결합한 8만 5,000개 데이터세트를 이용해 기계학습을 한 것이다. 이에 따르면 스팸 계정에는 프로필 이미지가 설정되어 있지 않거나 팔로어 수가 비정상적으로 적거나 트윗 수가 적고 계정명이 특정 키워드와 패턴으로 구축되는 등 특징이 있다고 한다. 스파크토로 측은 자사 스팸 계정 특정 모델은 65% 이상 정확도로 스팸 계정을 올바르게 식별할 수 있으며 스팸이나 가짜 계정을 일반 계정으로 잘못 식별할 수 있지만 일반 계정을 스팸이나 가짜 계정으로 잘못 식별하는 일은 거의 없다고 밝히고 있다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사