테크레시피

마이크로소프트 “워드‧엑셀 사용자 데이터, AI 학습에 사용 안한다”

마이크로소프트 오피스에는 사용자의 데이터를 자동으로 분석해 디자인과 편집을 제안하는 기능(Connected experiences)이 탑재되어 있다. SNS에서 이 연결 환경을 통해 마이크로소프트가 사용자 워드와 엑셀 파일에서 텍스트 데이터를 자동으로 수집해 대규모 언어 모델 훈련에 활용하고 있다는 주장이 나왔고 마이크로소프트가 이를 공식적으로 부인했다.

리눅스 관련 블로그를 운영하는 닉스크래프트(nixCraft)는 엑스를 통해 마이크로소프트 오피스에서 연결 환경이 기본값으로 켜져 있는 건 워드나 엑셀 문서를 스크래핑해 AI를 훈련시키기 위한 것이라 주장하며 워드를 사용해 소설이나 대본을 쓰는 작가에게 연결 환경 설정을 수동으로 끄도록 호소했다.

하지만 워드와 엑셀에서 수집한 텍스트 데이터가 AI 훈련에 사용되고 있다는 주장에는 실제로 사용자 데이터가 AI 학습에 사용됐다는 구체적인 증거가 없다. 또 문서에도 AI 학습에 대한 언급이 없다는 답글도 게시됐다.

이어 마이크로소프트 365 공식 계정이 해당 게시물에 답글을 통해 마이크로소프트 365 앱에서는 대규모 언어 모델 훈련에 고객 데이터를 사용하지 않는다며 이 설정은 문서 공동 편집 등 인터넷 액세스가 필요한 기능만 활성화된다는 말로 AI 학습에 대한 의혹을 부인했다.

참고로 연결 환경 기능을 끄려면 마이크로소프트 오피스 소프트웨어 파일에서 옵션을 선택한 뒤 보안 센터 내 보안 센터 설정에서 개인정보 옵션→개인정보 설정→선택적 연결 환경 확인란을 해제해야 한다. 이 연결 환경을 끄는 절차가 복잡하기 때문에 보도에선 연결 환경이 옵트아웃 기능으로 되어 있고 기본값으로 활성화되어 있다는 점에 비판의 여지가 있다고 지적했다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사