
AI 기업 앤트로픽(Anthropic)이 채팅 AI의 악용 사례와 대책 방법을 정리한 보고서를 공개하고 SNS상에서 다수 가짜 계정을 만들어 특정 정치적 메시지를 확산시키려는 조직적 활동을 저지했다고 보고했다.
앤트로픽은 문제의 활동을 한 건 여론 유도 서비스를 제공하는 영리 조직으로 여러 의뢰자로부터 일을 수주했다고 보고했다. 각 의뢰자 정치와 사상은 달랐지만 이 조직은 모든 프로젝트를 같은 시스템으로 운영했다고 한다.
조사에 따르면 이 조직은 엑스와 페이스북에 100개 이상 계정을 만들어 정치적으로 일관성 있는 계정 네트워크를 구축했음이 밝혀졌다. 이들 계정은 모두 가짜이며 다양한 언어를 구사하며 특정 사상에 대해 댓글을 달았지만 모두 클로드 등 AI로 구동되었고 인간이 관여하지 않았다고 한다.
이런 가짜 계정은 진짜 사람 사용자 수만 명과 교류하며 큰 영향력을 발휘했고 유럽과 이란, 아랍에미리트, 케냐의 커뮤니티에서 정치적으로 편향된 스토리를 전개했다.
앤트로픽은 이번 조사에서 밝혀진 사례에 대해 AI에 의해 강화된 여론 유도 서비스 진화를 보여준다고 말하며 기술 인프라가 정치적 목표와 분리되어 있다, 단일 운영자가 여러 의뢰자에게 동시에 대응할 수 있다, AI가 전략적, 전술적 결정을 내린다, 콘텐츠가 정당해 보이고 패턴이 인간 행동을 모방하기 때문에 탐지가 점점 어려워진다는 점에 주목했다.
또 앤트로픽은 다른 사례로 클로드를 사용해 오픈소스 툴킷을 재작성하고 보안 카메라 관련 비밀번호와 사용자명을 스크래핑하는 도구를 개발하는 것, AI를 사용해 외국어로 커뮤니케이션하는 구인 사기, 초보자가 클로드를 사용해 멀웨어를 개발하는 것 등 사례도 확인됐다고 보고했다.
앤트로픽은 AI를 도입하는 장벽이 낮아지면서 이번과 같은 여론 유도 서비스가 앞으로 더 일반화될 것으로 예상했다. 이런 AI를 활용한 인플루언서 마케팅 활동 식별과 저지에 노력하는 동시에 광범위한 보안 및 안전 커뮤니티와의 지식 공유를 계속하겠다고 약속했다. 관련 내용은 이곳에서 확인할 수 있다.