테크레시피

AI 안전성에 대한 접근 발표한 오픈AI

이미지나 문장 등 콘텐츠를 자동 생성하는 제너레이티브 AI는 진화를 계속하고 있지만 AI에 대해 법적 규제를 마련해야 한다는 목소리도 나오고 있다. 이런 가운데 대규모 언어 모델인 GPT-4와 대화형 AI인 챗GPT를 개발하는 AI 개발 단체인 오픈AI가 AI 안전성에 대한 접근을 공개했다.

오픈AI는 새로운 시스템을 출시하기 전에 엄격한 테스트를 실시하고 외부 전문가에게 피드백을 요구하고 인간 피드백에 의한 강화학습 등 방법을 이용해 모델 동작을 개선하고 광범위한 안전, 모니터링 시스템을 구축한다고 밝혔다. 예를 들면 GPT-4 학습이 종료되어 일반 공개하기 전에 오픈AI 전체로 6개월 이상에 걸쳐 더 안전하고 일관성이 있는 것으로 하는 작업을 실시했다고 한다.

오픈AI는 자사는 강력한 AI 시스템이 엄격한 안전성 평가를 받아야 한다고 생각한다며 이런 규제가 취할 수 있는 최선의 형태에 대해 정부와 적극 협의하고 있다고 밝혔다.

다음은 대규모 조사와 테스트를 실시해도 기술 용도를 모두 예측할 수 있는 건 아니며 연구로 배울 수 있는 것도 한계가 있다고 한다. 오픈AI는 실제로 AI를 사용해 보고 학습할 수 있는 건 시간이 지나면서 점점 더 안전해지는 AI 시스템을 출시하는 중요한 요소라고 믿고 있다며 신중하고 서서히 새로운 AI 시스템을 발표하고 충분한 보호 수단을 강구하는 한편 꾸준히 확대되는 그룹에게 제공해 피드백을 바탕으로 꾸준한 개선을 실시할 것이라고 선언했다.

또 오픈AI는 개발자가 이 기술을 앱에 직접 통합할 수 있도록 자체 서비스와 API를 통해 최상 모델을 활용할 수 있도록 하고 있다. 이에 의해 부정 사용을 감시, 대책을 강구할 수 있어 AI 시스템 부정 사용에 대한 대책을 계속 확인할 수 있다는 것. 오픈AI 측은 중요한 건 사회에서 AI 능력이 향상되어 적응하는 시간을 확보할 필요가 있으며 이 AI 기술 영향을 받는 모든 사람이 AI가 더 발전하는 방법에 대해 중요한 발언권을 갖고 있어야 한다고 밝혔다.

오픈AI는 안전에 대한 대처 일환으로 AI 도구 사용에 18세 이상 혹은 보호자 승인을 얻은 13세 이상이라는 연령 제한을 검토하는 걸 밝혔다. 또 오픈AI는 증오, 괴롭힘, 폭력, 성인 콘텐츠와 같은 분야를 오픈AI 기술로 만들 수 없다는 비율이 82%로 낮아졌다. 또 아동 성적 학대 소재를 이미지 도구에 업로드하려고 하면 차단 후 통보한다고 선언했다.

오픈AI는 또 비영리단체 칸아카데미(Khan Academy)와 연계해 학생용 고사나 어시스턴트 역할을 하는 AI를 구축하고 있다고 한다.

오픈AI는 자사 대규모 언어 모델은 공개된 콘텐츠, 라이선스 콘텐츠와 인간 리뷰 담당자가 생성한 콘텐츠를 포함한 광범위한 텍스트 코퍼스에서 학습 받고 있다. 구글은 서비스 판매, 광고 또는 사람 프로필을 구축하는데 데이터를 사용하지 않는다고 선언했다.

또 학습용 데이터에는 인터넷에서 사용 가능한 개인 정보가 포함되어 있으므로 가능한 경우 학습 데이터세트에서 개인 정보를 삭제하고 모델을 미세 조정해 사용자 개인 정보 요청을 거부하고 사용자로부터 개인 정보를 시스템에서 삭제하는 요청에 해당하는 절차는 모델이 개인 정보를 포함하는 답변을 생성할 가능성을 최소화한다고 한다.

대규모 언어 모델인 GPT-4를 기반으로 한 챗GPT는 인간 수준 정밀도로 자연스러운 문장을 생성하기 위한 모델이지만 이 생성 방법은 학습 패턴에 따라 다음에 계속되는 단어를 예상하고 확률적으로 문장을 생성한다. 이 때문에 해당 내용에 대해선 반드시 사실이라고 할 수 없다. 따라서 GPT-4에선 챗GPT 출력에 대한 사용자 피드백을 활용해 사실 정확성 향상을 도모하고 있다는 것. 이에 따라 GPT-4는 GPT-3.5에 비해 사실 기반 콘텐츠를 생성할 가능성이 40% 향상됐다고 한다.

오픈AI는 AI 안전성에 대한 우려를 해결하기 위한 실용적 접근 방법은 효과적인 경감책과 조정 방법을 연구하고 실제 악용에 대해 이를 테스트하기 위해 더 많은 시간과 자원을 소비하는 것으로 보고 있다. 정책 입안자와 AI 제공자는 AI 개발과 전개가 전 세계적으로 효과적으로 관리되고 있는지 확인해야 한다며 과제지만 이에 기여하고 싶은 과제라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사