마이크로소프트가 11월 미국 출판사 하퍼콜린스(HarperCollins)와 AI 모델 학습을 위한 계약을 체결하고 일부 논픽션 도서를 AI 모델 훈련에 사용하는 걸 허가받았다는 보도가 나왔다.
마이크로소프트를 비롯한 기술 기업은 AI 모델 학습 정확성을 높이고 특정 주제에 대한 전문 지식을 출력할 수 있도록 SNS 게시물, 뉴스 기사 등 다양한 데이터를 활용하고 있으며 고품질 텍스트 자료에 대한 라이선스를 적극적으로 모색하고 있다.
하퍼콜린스는 여러 해외 언론을 통해 AI 모델 품질 및 성능 향상을 목적으로 특정 논픽션 도서를 제한적으로 사용할 것을 허가하는 계약을 익명 AI 기술 기업과 체결했다고 밝혔다. 또 하퍼콜린스는 몇 가지 입장을 덧붙였다. 먼저 저자에게 AI 학습에 도서를 제공할지 여부를 검토할 기회를 제공하는 게 자사 역할 중 하나라는 것. 다음으로 이번 계약은 제한된 범위 내에서 이뤄졌으며 저작권자 권리를 존중하는 AI 모델 출력 기준을 명확히 설정한 점에서 성사됐다는 것이다. 이는 AI 훈련에 도서를 사용할지 여부를 저자에게 맡기겠다는 방침을 의미다.
미국 아동문학 작가 다니엘 키블스미스는 11월 하퍼콜린스로부터 이전에 출판한 도서를 AI 모델 학습에 사용해도 되는지를 묻는 이메일을 받았다고 밝혔다. 이 이메일에서는 몇 가지 보상 구조를 제시했다. 한 권당 3년간 2,500달러를 지급하며 AI 모델을 출력할 때 크레딧 보호와 생성된 응답에 대한 일부 제한 조건 설정이 그것이다.
하퍼콜린스는 계약 상대 기업 신원을 공개하지 않았지만 보도에 따르면 익명 관계자를 통해 해당 기업이 마이크로소프트임을 확인했다고 한다. 관계자에 따르면 마이크로소프트는 하퍼콜린스 도서를 학습 데이터로 사용할 뿐 AI로 책을 작성할 계획은 없다고 한다. 마이크로소프트는 이번 계약에 대한 언론 질문에 응답하지 않았다.
마이크로소프트는 11월 18일부터 시작된 개발자 콘퍼런스인 마이크로소프트 이그나이트 2024(Microsoft Ignite 2024)에서 AI 및 기술 관련 발표를 진행했다. 주요 발표 내용을 보면
첫째 양자 컴퓨터 상용화. 아톰 컴퓨팅(Atom Computing)과 협력해 2025년 양자 컴퓨터를 출시할 예정이다. 둘째 마이크로소프트 팀즈 실시간 음성 번역. 화자 음성을 실시간으로 번역하는 인터프리터 인 팀즈(Interpreter in Teams) 기능 발표. 셋째 AI 기반 PC 및 코파일럿 스튜디오. AI 수행에 적합한 코파일럿+ PC 출시와 코파일럿 스튜디오를 통한 맞춤형 AI 도우미 생성 기능 강화, 애저 AI와 직접 연결하는 기능 추가 등이다. 넷째 애저 AI 파운드리(Azure AI Foundry) 및 개발자 도구. 생성 AI 개발 허브 플랫폼인 애저 AI 파운드리를 발표하고 개발자 AI 응용 프로그램 제작 지원을 위한 애저 AI 파운드리 SDK를 발표했다.
5번째는 고성능 컴퓨팅(HPC) 최적화. 애저 HBv5 버추얼 머신은 메모리 대역폭 최대 8배 개선하고 데이터 트래픽 및 네트워크 효율성을 개선한 하드웨어인 애저 부스트 DPU를 발표했다. 마지막으로 보안 강화. 데이터 암호화와 디지털 서명에 사용되는 클라우드 보안 칩(Azure Integrated HSM)을 발표했다.
이번 마이크로소프트와 하퍼콜린스 계약은 AI 기술 개발과 콘텐츠 산업 협력 가능성을 보여준다. 하지만 저작권 보호, 보상 구조, 데이터 사용 방식 등에서 추가 논의가 필요할 것으로 보인다. 마이크로소프트는 이런 기술을 통해 애저 AI와 코파일럿 플랫폼에서의 경쟁력을 한층 강화하려는 의지를 드러냈다. 관련 내용은 이곳에서 확인할 수 있다.