AI 진화로…봇이 인간보다 CAPTCHA 인증 빨리 돌파

인터넷에서 서비스를 이용할 때 자신이 로봇이 아니라는 걸 증명하기 위해 캡차(CAPTCHA. Completely Automated Public Turing test to tell Computers and Humans Apart)라는 테스트가 필요할 수 있다. 캡차에 대한 조사를 실시한 캘리포니아대 연구팀 실험에선 캡차 테스트 해독 속도나 정답률은 인간보다 봇이 뛰어난 것으로 판명됐다.

캡차는 왜곡된 문자를 읽고 입력하거나 제시된 테마에 따라 여러 이미지를 선택해 사용자가 사람인지 봇인지 식별하는 시스템이다. 웹사이트 관리자는 캡차를 도입해 사이트를 크롤링하는 봇이나 검색엔진에 스팸 URL을 추가하려는 봇으로부터 온라인 시스템과 양식을 보호할 수 있다. 한편 웹사이트 방문자에게 캡차는 귀찮은 존재이기도 하다. 연구팀은 인간 피험자와 봇에게 캡차를 돌파시켜 돌파에 걸리는 시간과 성공률을 비교하는 실험을 실시했다.

연구팀은 캡차를 도입한 120개 웹사이트를 추출하고 피험자 1,000명에게 120개 웹사이트 중에서 무작위로 추출한 10개 사이트에서 캡차에 도전하도록 요구했다. 동시에 연구팀은 캡차 테스트를 돌파하기 위해 지금까지 만들어진 다양한 봇과 인간을 비교했다.

조사 결과 왜곡된 텍스트를 해독하는 타입 캡차는 봇이 99.8%라는 고정밀도로 1초 미만 엄청난 속도를 보인 것에 비해 인간은 50∼84% 정밀도로 9∼15초 걸린 것으로 보고됐다. 또 이미지를 선택하는 타입 캡차에선 봇 정답률이 85%까지 떨어졌지만 인간 정답률인 81%를 조금 웃도는 것으로 보고됐다.

캡차 인증 종류에 따라 인간 돌파 시간을 보면 구글이 개발한 리캡차(reCAPTCHA)가 10초 미만 짧게 돌파되는 반면 다른 캡차(Arkose MatchKey, hCaptcha)는 돌파에 수십 초가 걸린다.

연구팀은 또 사용자 유형과 환경별로 캡차 응답 속도를 조사했다. 그 결과 사용자 연령이나 인터넷 이용 기기, 이용 목적, 학력 등 요인에 따라 캡차 해답 속도가 다른 것으로 판명됐다. 온라인 게임을 플레이하는 사용자가 직장이나 인터넷 서핑, 교육에 인터넷을 쓰는 사용자보다 캡차 응답 시간이 짧다고 한다. 학력별로 캡차 회답 시간을 보면 박사 학위를 가진 사용자는 응답 시간이 짧은 것으로 보고됐다.

연구팀은 왜곡된 텍스트나 이미지 선택 등을 이용해 인간과 봇을 구별하는 쉬운 방법은 더 이상 없다면서 캡차가 아닌 지능형 알고리즘을 도입, 봇에 의한 접근을 인간과 구별할 필요가 있다고 지적했다. 한 연구자는 고도의 AI가 폭발적으로 증가하면서 캡차는 시대에 뒤처지고 있다고 지적한다. 캡차는 더 이상 보안 목표를 달성하기 어렵다는 것. 행동 분석을 이용한 더 역동적인 접근 등 새로운 접근법이 요구된다는 설명이다. 관련 내용은 이곳에서 확인할 수 있다.