美 AI 모델 학습 데이터 공개 의무화 법안 제출

미국 캘리포니아주와 버지니아주 민주당 의원들이 AI 모델 학습 데이터에 저작권으로 보호된 데이터가 이용되고 있는지 여부를 명확히 하기 위해 교육 데이터 소스를 공개하도록 요청하는 법안을 제출했다.

제출한 법안은 AI 재단 모델 투명법(AI Foundation Model Transparency Act). 이 법안은 연방거래위원회 FTC에 대해 미국국립표준기술연구소 NIST와 협력해 AI 모델 학습 데이터 투명성 향상을 위한 규칙을 수립하기 위해 제출된 것이다.

이 법에선 AI 모델을 만드는 기업은 교육 데이터 소스와 추론 프로세스 중 데이터 보유 방법, 모델 제한 및 위험에 대한 설명, NIST가 계획하는 AI 위험 관리 프레임워크 혹은 다른 연방 기준에 AI 모델이 어떻게 정합하는지 설명, AI 모델 학습과 실행에 사용되는 계산 능력에 관한 정보 등을 공개하는 게 의무화된다.

또 AI 개발자는 의료와 건강 관련 질문, 생물학적 합성, 사이버 보안, 선거, 경찰, 금융 대출, 교육, 고용, 공공서비스, 아이 등 사회 적약자 등에 관한 부정확하거나 유해한 정보를 AI 모델이 제공하지 못하게 하기 위한 노력을 보고하는 것도 의무화된다.

법안을 제출한 의원은 AI 기업이 저작권 침해에 관한 여러 소송에 직면하고 있기 때문에 이 법안과 같은 학습 데이터 투명성의 중요성을 호소했다. 법안 중에는 구체적으로 스태빌리티AI, 미드저니, 디비안아트에 대한 아티스트에 의한 소송, 스태빌리티AI에 대한 게티이미지 소송 등을 들고 있다.

법안에는 AI에 대한 공중 접근이 증가하면서 저작권 침해에 관한 소송과 국민 우려가 증가하고 있다며 이런 우려에 대처하기 위해 AI 모델 기초가 되는 학습 데이터 투명성을 호소하고 있다. 덧붙여 이 법안은 AI 모델 보고 기준 확립에 도움을 주기 위해 바이든 대통령이 발령한 AI에 관한 대통령령을 보완하는 게 된다는 지적이다. 덧붙여 AI에 관한 대통령령은 어디까지나 대통령령이며 법률이 아니기 때문에 AI 재단 모델 투명 법안이 가결된다면 동법률이 더 엄격한 규제가 된다. 관련 내용은 이곳에서 확인할 수 있다.