테크레시피

MS, AI로 게임 음성 대화 필터링하려 한다

마이크로소프트가 엑스박스 라이브 사용자가 수신한 문자 메시지에 잘못된 내용이 표시되지 않게 사용자 설정에 따라 인공지능이 자동으로 내용을 제한하는 필터를 적용하겠다고 발표했다. 또 미래에는 엑스박스 라이브에서 이뤄지는 음성 채팅을 실시간으로 필터링하는 기능도 탑재할 예정이라고 한다.

인터넷을 통해 전 세계인과 게임을 하면 자연스럽게 이메일이나 음성 채팅 같은 커뮤니케이션을 하게 된다. 하지만 모르는 사람과 게임을 하다 보면 때론 욕설이나 차별적 메시지 등 부적절한 내용이 포함될 수도 있다.

엑스박스 라이브에선 먼저 4단계(Friendly, Medium, Mature, Unfiltered) 중 선택한 텍스트 메시지에 포함된 내용을 필터링할 수 있다. 프렌들리는 가장 어린이용 수준으로 잠재적으로 부정적 메시지를 뺄 수 있도록 설계한 것이다. 반대로 언필터드의 경우 전혀 필터링을 하지 않는 설정이다. 또 가족 계정을 보유하고 있다면 보호자는 가족 설정을 이용해 엑스박스 원, 윈도10, iOS나 안드로이드용 엑스박스 앱에서 자녀 계정 필터링을 설정, 관리할 수 있다.

실제로 외신에서 마이크로소프트 AI 필터링 정확도를 확인하기 위해 엑스박스 라이브 계정에 욕설을 여러 번 보내 필터링을 하는지 테스트를 한 결과 필터링을 피하기 위해 기존 기술을 이용해도 마이크로소프트 AI는 특정 단어나 메시지를 빼는 등 상당히 정확한 필터링을 실현했다고 한다. 다만 인터넷에서 특정 커뮤니티를 공격하는 문구나 밈이 즉시 만들어지기 때문에 마이크로소프트의 필터링 역시 절대적이라고 확신하기는 어려울 수 있다.

한편 부정적인 말이라고 해서 반드시 나쁜 의미로 썼다고 할 수는 없기 때문에 정확한 필터링은 상당히 복잡한 알고리즘을 요구한다. 예를 들어 온라인 멀티 플레이어가 XX에 있는 적을 먼저 죽이라는 메시지로 작전을 제안할 때 살인이라는 부정적 단어가 메시지에 들어가지만 문맥을 감안하면 문제가 있는 대화는 아니다.

마이크로소프트 엑스박스 운용 책임자인 데이브 매카시는 게임 공간에서 대화 맥락이라는 건 상당히 성가신 일이라면서 인공지능을 이용한 필터링으로 문맥과 뉘앙스를 이해하는 방법을 찾는 건 끝없는 싸움이라고 설명했다.

마이크로소프트는 공식 블로그를 통해 결국 기존 사업을 보완하고 AI와 기계학습 기술에 노력을 더해 엑스박스 라이브에서 모든 종류의 콘텐츠를 필터링하고 개별 플레이어에게 제공하는 걸 목표로 하고 있다고 밝히고 있다. 다시 말해 텍스트 메시지 뿐 아니라 엑스박스 라이브 내 음성 채팅도 실시간 필터링하는 걸 검토하고 있다는 의미다.

마이크로소프트는 음성을 실시간으로 텍스트화하는 위해 음성 읽기 기능을 이미 개발하고 있으며 엑스박스 라이브에도 기술 적용을 검토하고 있다고 한다. 하지만 음성을 실시간으로 분석하면 아무래도 지연이 발생해 즉시성이 요구되는 게임 내 음성 채팅에 응용하는 건 어려운 일이다. 음성을 텍스트로 실시간 변환해 이를 필터링하면 음성 대화에서도 필터링이 가능하다는 의문에서 개발을 시작했지만 아직까지 시작한지 얼마 되지 않은 상태라고 한다.

엑스박스 라이브 팀 측은 최종 목표는 실시간으로 음성 대화에서 욕을 감지하고 이를 보고 듣고 싶지 않은 사용자에게 경고음으로 통지해주는 것이지만 이를 향해 한 걸음씩 내딛고 있는 단계라고 설명하고 있다. 관련 내용은 이곳에서 확인할 수 있다.