테크레시피

챗GPT 언제부터 검열했나…中 방화벽 추적 시스템 공개

중국 정부는 국내 인터넷 통신을 감시하기 위해 그레이트 파이어월이라는 국가 규모 검열 시스템을 운영하고 있다. 이 그레이트 파이어월이 차단하는 도메인을 추적하는 시스템인 GFWeb이 공개되어 중국이 언제부터 챗GPT 같은 AI 사이트를 차단했는지와 같은 정보가 밝혀졌다.

그레이트 파이어월은 필터링 기능을 지속적으로 조정하고 있으며 어떤 웹사이트를 차단했는지 분석하는 게 중국 정부 방침과 태도를 이해하는 데 도움이 된다. 하지만 중국 당국이 특정 도메인을 차단한 시기를 정확히 알려면 개별 연구자가 특정 도메인에 대해 지속적으로 테스트하는 수밖에 없어 어려움이 있었다.

이에 온라인 검열과 감시에 관한 연구 프로젝트를 지원하는 비영리 단체인 OTF(Open Technology Fund) 자금 지원으로 매월 도메인 수억 개를 추적해 그레이트 파이어월에 차단됐는지 여부를 측정하는 플랫폼 GFWeb이 구축됐다. GFWeb 구축에는 브리티시컬럼비아 대학과 시카고 대학, 토론토 대학에 거점을 둔 시티즌랩(Citizen Lab), 카네기 멜론 대학, SRI 인터내셔널, 스토니브룩 대학 등 연구자가 협력했다. GFWeb은 이미 무료로 일반에 공개되어 있으며 플랫폼이 정리한 몇 가지 정보를 확인할 수 있을 뿐 아니라 구글 드라이브에서 원시 데이터를 얻을 수도 있다.

GFWeb에 따르면 현재 그레이트 파이어월이 차단하고 있는 도메인은 HTTP 기반으로 96만 5,233개라고 한다. 최근 차단된 도메인으로는 음악 스트리밍 서비스 디저(Deezer) 도메인(deezer.com)이 2024년 8월 3일부터, 분산형 SNS 블루스카이(Bluesky) 도메인 (bsky.app)이 2024년 6월 15일부터 차단됐다고 보고되고 있다.

또 지난 3개월 이내에 검열된 도메인을 카테고리별로 분류하면 1위가 성인 콘텐츠, 2위가 파일 공유/저장으로 나타났다. 비즈니스, 도박, 뉴스/미디어, 엔터테인먼트 같은 카테고리도 차단되고 있다.

GFWeb 개발자 중 한 명은 GFWeb은 검열 이벤트 시기와 범위를 추적하는 능력을 높일 뿐 아니라 그레이트 파이어월이 채택한 전략 패턴과 변화를 식별하는 데 도움이 된다며 GFWeb이 연구자, 정책 입안자, 일반인에게 중국 검열 변화에 대해 더 깊은 통찰력을 제공하기를 바란다고 말했다.

실제로 GFWeb을 사용해 조사한 결과 중국 당국이 챗GPT 도메인을 2023년 3월 2일 차단했다는 것과 기계 학습 플랫폼인 허깅페이스도 같은 해 5월 7일 차단됐다는 것을 알 수 있었다. 허깅페이스는 2023년 10월 중국에서 도메인이 차단되고 있는 문제에 대해 보고했지만 그동안 정확한 차단 시기는 알려지지 않았다고 한다.

또 중국 당국이 콘텐츠를 생성하는 AI 도구에 대한 검열을 적극적으로 하고 있다는 것도 GFWeb 조사를 통해 밝혀졌다. 분석에 따르면 중국의 AI 관련 웹사이트 차단은 새로운 AI 규제 통과와 같은 중요한 이벤트와 상관관계가 있는 것으로 나타났다. 예를 들어 2024년 봄에는 Biblechat.ai, Church.ai와 같은 종교 관련 AI 웹사이트 수백 개가 차단됐는데 이는 영적인 AI 애플리케이션이 급증한 시기와 일치한다.

전문가는 이는 중국 공산당이 정부가 관리하지 않는 콘텐츠 생성 플랫폼에 민감하다는 걸 보여준다며 이게 중국 공산당에게는 주요 위협이라면서 AI 사이트를 차단해도 개발자가 VPN을 사용해 이런 도구에 접근하는 걸 막을 수는 없을 것이라고 밝혔다. 하지만 평균적인 중국인이 AI를 사용해 중국 공산당 지도자를 조롱하는 비디오나 중국의 부패에 관한 글 등 정치적으로 민감한 콘텐츠를 생성하는 건 어려워진다고 말했다.

또 중국 인터넷 검열을 분석하고 회피하기 위한 도구를 제공하는 ‘GreatFire.org 공동 설립자인 찰리 스미스는 GFWeb이 연구자에게 흥미로운 가능성을 제공한다고 주장했다. 정확한 검열 날짜를 아는 건 여러 가지 이유로 유용하다면서 예를 들어 특정 이벤트 전후 웹사이트가 차단됐는지 여부를 확인할 수 있다며 또 당국이 어떻게 웹사이트를 차단하고 있는지를 보여주는 데도 도움이 된다면서 당국이 패턴에 따라 웹사이트를 차단하고 있는지 여부를 이를 통해 확인할 수 있다고 말했다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독