테크레시피

브레이브 서치, 웹 저작권 콘텐츠 수집해 유료 판매중?

광고 차단 기능을 표준 탑재한 브라우저 브레이브(Brave) 개발팀은 프라이버시 특화형 검색 엔진인 브레이브 서치(Brave Search)도 개발하고 잇다. 브레이브 서치 검색 결과 화면에는 검색어에 맞춰 웹사이트 문장을 발췌한 스니펫(Snippet)이 표시되지만 한 소프트웨어는 브레이브 서치 스니펫에 대해 웹사이트 내용을 마음대로 수집해 저작권자 허가 없이 타인에게 판매하고 있다고 지적하고 있다.

구글에서 특정 단어를 검색하면 검색 결과 상단에 웹사이트 일부를 추출한 강조된 스니펫이 표시될 수 있다. 브레이브 서치에도 같은 스니펫 기능이 탑재되어 있다. 예를 들어 브레이브 서치에서 브레이브 서치라는 말로 검색하면 화면 오른쪽에 위키피디아 기술을 뽑아낸 스니펫이 표시된다.

브레이브 서치 검색 결과 화면에 표시되는 스니펫은 짧은 문장으로 이뤄져 있지만 브레이브 서치 유료 API를 확인한 결과 ‘extra_snippets’로 긴 문장을 얻을 수 있다는 게 밝혀졌다. 또 위키피디아 이외 영리기업이 운영하는 뉴스 사이트 정보도 스니펫으로 취득할 수 있다는 게 확인됐다.

브레이브 서치 유료 APII 플랜 중 일부는 스니펫 정보를 AI 학습에 사용할 수 있게 하는 것도 있으며 스니펫 정보를 로컬에 저장할 수 있는 것도 있다. 이런 사실에서 브레이브 서치가 저작권으로 보호된 정보를 수집하고 타인에게 유료 판매하고 있다고 지적하는 것.

웹사이트 관리자는 ‘robots.txt’ 내용을 편집하고 크롤러 사용자 에이전트를 지정해 크롤러에 의한 정보 수집을 거부할 수 있다. 하지만 브레이브 서치는 사용자 에이전트를 공개하지 않는다. 이 때문에 브레이브 서치에 의한 정보 수집을 선택적으로 배제할 수 없다는 점도 문제시하고 있다.

브레이브 서치 측은 이에 대해 브레이브는 브레이브 서치 출력을 수익화할 권리가 있다며 브레이브 서치 크롤러는 검색엔진에 의한 인덱스 자체를 거부하고 있는 사이트나 구글봇을 차단하고 있는 사이트는 크롤링하지 않게 설계되어 있다고 밝혔다. 하지만 위 내용을 지적한 소프트웨어 엔지니어는 브레이브 서치가 검색엔진이라는 이유만으로 저작권으로 보호된 콘텐츠를 수익화해 이용할 권리가 있는 것 같다며 브레이브 서치 측 대응을 비난했다.

참고로 채팅 AI인 챗GPT에도 인터넷상을 검색해 정보를 표시하는 웹브라우징 플러그인이 존재하고 있지만 7월 유료 기사를 무료로 읽어 버린다는 보고에 따라 수신 기능이 일시 중단됐다. 하지만 챗GPT는 크롤러 사용자 에이전트를 게시하고 있어 ‘robots.txt’를 편집해 정보 수집을 명시적으로 차단할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독

Most popular