구글 AI 챗봇인 바드(Bard)가 EU를 포함한 많은 국가에서 정식으로 이용 가능하게 됐다. 하지만 여전히 AI에 대한 경계심을 가진 국가에서 접근할 수 있도록 구글이 상당한 노력을 기울인 것으로 보인다. 규제 당국은 구글이 앞으로도 정기적인 개인 정보 보호 보고서를 제공하고 사용자 데이터를 안전하게 유지하기 위해 추가 약속을 해야 한다고 말한다.
얼마 전 구글은 바드에 더 많은 언어가 추가됐다고 발표했다. 최신 업데이트에서 사용할 수 잇는 43개 새로운 언어로는 아랍어, 덴마크어, 불어, 독일어, 힌디어, 중국어, 스페인어, 포르투갈어 등이 있으며 자주 사용하는 방언도 포함된다.
구글은 이전에 개인 정보 보호 문제로 EU 런칭을 연기했지만 이번 업데이트에선 전 세계 모든 지역에서 사용할 수 있으며 브라질과 EU 사용자도 액세스할 수 있다. 구글이 바드를 발표한 건 지난 3월. 이후 경쟁사인 오픈AI와 마이크로소프트간 차이를 줄이기 위해 많은 업데이트를 할 것이라고 발표한 바 있다.
현재는 마이크로소프트 빙챗 검색에 대항해 AI를 지원하는 구글 검색 베타테스트도 진행하고 있다. 챗GPT는 수십 개 언어를 지원하지만 공식적으로 여러 언어를 지원하는지 여부는 발표되지 않았다.
추가 기능도 제공된다. 바드 페이지 왼쪽에 위치한 대화 목록에서 특정 대화를 고정해 이름을 변경할 수 있게 된다. 또 바드 답변을 음성으로 확인할 수 있게 됐다. 대화 링크를 공유할 수도 있다. 구글은 또 바드에서 이미지를 공유할 수 있도록 구글 렌즈와 비슷한 기능도 추가한다. 이미지 설명을 해주고 심지어 캡션도 붙여준다고 한다. 다만 이 기능은 현재 영어만 지원하며 앞으로 다른 언어로도 가능하도록 할 예정이라고 한다.
구글 측은 바드팀이 언어별 구사자를 모아 AI에서 해로운 답변을 얻게 테스트를 해봤다고 한다. 하지만 AI 채팅봇이 다국어를 지원하더라도 학습은 서양 위주다. AI가 언어를 이해하는 방법이 이미 있는 데이터를 이용하고 있기 때문이다. 데이터 대부분은 영문 위키피디아와 책, 서양 걸 이용하고 있다. 일부 연구 조사에 따르면 AI가 학습하고 있는 데이터 50% 이상이 미국에서 웹호스팅되고 있다고 한다. 학습 데이터가 서양 것이라는 건 AI로부터 나오는 답변이 어떤 언어라도 결국 서양 바이어스가 있다는 얘기다. 구글은 사용자 입력을 기반으로 AI를 학습해 나가지만 문화적 격차를 메우기 위해선 사용자로부터 상당한 데이터가 필요하게 될 것이다.
한편 AI에 대해 강경한 태도를 취하고 있는 EU 시장은 구글에도 엄격한 잣대를 들이대고 있다. 아일랜드 데이터보호위원회는 구글이 앞으로 몇 개월 안에 규제 당국에 대한 개인 정보 보호 보고서를 작성하기로 동의했다고 밝혔다. 챗GPT 개발사인 오픈AI도 EU에선 고전하고 있다. 관련 내용은 이곳에서 확인할 수 있다.