테크레시피

슬랙, 동의 없이 메시지 등 AI 학습에 활용

슬랙(Slack)이 사용자 메시지, 데이터, 파일, 기타 콘텐츠를 기계학습 모델 훈련에 활용해 온 사실이 밝혀졌다. 개인정보 보호정책이 2023년 9월에 변경됐지만 많은 사용자가 이를 알아차리지 못했고 슬랙이 명시적인 사용자 동의 없이 데이터를 훈련에 사용해온 것으로 지적되고 있다.

고성능 AI를 뒷받침하려면 고품질 대량 데이터가 필요하지만 전문가는 2026년까지 AI 학습 데이터가 고갈될 위험이 있다고 지적하고 있다. 이에 어도비는 동영상 생성 AI인 파이어플라이를 위해 동영상 소스 제공에 대한 보상금을 내걸기도 했다.

한편 사용자가 콘텐츠를 업로드하는 플랫폼에서는 업로드된 콘텐츠를 AI 훈련에 활용하는 움직임이 있다. 2023년 9월 개정된 슬랙 개인정보 보호정책은 이런 흐름에 해당하며 AI·기계학습 모델 개발을 위해 슬랙에 전송된 고객 데이터(메시지, 데이터, 파일 등)를 분석한다고 명시했다. 하지만 슬랙 AI 페이지에는 고객 데이터는 고객 것이며 그 데이터가 슬랙 AI 훈련에 사용되는 일은 없다는 모순된 문구가 있었다.

이에 대한 지적이 있자 슬랙은 5월 17일 정책 문구를 수정했다고 발표했다. 슬랙에 따르면 업계 표준 프라이버시 보호 기계학습 기술을 사용하고 있으며 이 기계학습 모델은 고객 데이터를 재현할 수 있는 방식으로 훈련되지 않는다고 한다.

또 슬랙 AI는 제3자 대규모 언어 모델을 활용한 제품이며 이 언어 모델 훈련에 슬랙 고객 데이터는 사용되지 않았다고 설명했다. 데이터를 AI 훈련에 사용되는 것을 원치 않을 경우 옵트아웃이 가능하지만 기업이나 조직에서 슬랙을 사용 중일 경우 개인 옵트아웃 설정은 할 수 없고 관리자에게 옵트아웃을 요청해야 한다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사