HAI(Stanford Human-Centered AI Institute)가 매년 AI에 대한 방대한 조사 자료를 정리한 AI인덱스(Artificial Intelligence Index) 2021년판을 발표했다. 이 보고서는 2020년 기승으로 부리던 코로나19가 AI 개발에 미친 영향 등 여러 관점에서 분석하고 있다.
AI인덱스는 스탠퍼드대학 HAI 소속 11명 운영위원회가 편집한 것으로 하버드대학과 경제협력개발기구, 파트너십온AI(Partnership on AI), SRI인터내셔널 등 단체 참여자가 텍스트를 정리했다. 이런 AI인덱스 2021년 버전은 2020년 AI 개발 주요 특징을 9가지로 정리하고 있다.
첫째는 약물 개발 AI 분야 투자가 크게 증가했다는 것. 약물 개발과 암 치료, 신약 개발 등 분야에서 AI 이용이 어느 때보다 주목받고 있으며 2020년에는 AI 관련 민간 투자와 M&A, 글로벌 투자 총액이 전년 대비 40% 가까이 증가했다. 2020년 민간 AI를 이용한 의약품 개발에 대한 투자 총액은 10.5조원대 이상을 기록하고 있으며 이는 2019년보다 4.5배에 해당한다.
실제로 AI를 이용해 기존 약물 중에서 다른 질병에 효과가 있는 걸 찾아내거나 AI를 이용해 유방암 발생을 예견하고 암 면역요법 효과가 있는 사람과 그렇지 않은 사람을 판별하는 노력이 이뤄지고 있기도 하다. 한편 AI 관련 스타트업에 대한 자금은 3년 연속으로 감소하고 있다.
둘째는 업계 변화가 계속되고 있다는 것. 2019년에는 북미 지역에서 박사 학위 수료자 65%가 AI 업계에 진출하고 있으며 이 수치는 2010년 44.4%에서 증가하고 있다.
셋째는 AI가 모든 걸 생성한다는 것. AI를 이용한 시스템은 텍스트와 오디오 이미지를 충분히 높은 수준에서 자동으로 생성할 수 있게 되어 있다. 따라서 인간은 AI가 생성하는 걸 AI가 생성한 것으로 인식하게 고생하고 있다. 예를 들어 AI를 이용해 가상 인간 사진을 생성할 수 있는 사이트(This person does not exist)를 이용하면 AI가 생성하는 사진 정도 수준을 실감할 수 있다.
또 실재하는 사람 사진과 AI가 생성한 가상 인물 얼굴 사진을 퀴즈 형식으로 분별하는 웹사이트도 등장하고 있으며 AI를 이용해 부담 없이 진짜인지 구별하기 어려운 수준 사진 생성을 실감할 수 있을 것이다. 하지만 소설 속 인물 사진을 생성할 수 있는 AI가 악용되고 있다고도 지적되고 있다.
AI를 이용한 오디오 분야 노력도 이뤄지고 있으며 음악에 맞춰 자동으로 드럼 파트를 연습해주는 드럼봇(DrumBot) 같은 웹 애플리케이션이 등장하고 래퍼 트래비스 스콧 악곡을 학습한 AI 트래시브봇(TravisBott)이 신곡을 발표하기도 했다.
원본 분야에선 너무 높은 정밀도 텍스트를 쉽게 만들어 버리기 때문에 개발팀이 너무 위험하다며 문제가 된 텍스트 생성용 AI 모델인 GPT-2 후속 모델 GPT-3이 2020년 6월에 공개되어 레딧에 일주일 AI와 주목받지 않고 인간과 상호 작용하던 게 화제를 모으기도 했다.
다음은 AI가 다양성을 과제로 한다는 것. 2019년 미국 거주자 박사 학위 수료자 가운데 AI 업계에 신입으로 채용된 인종은 백인이 45.6%, 아시아 22.4%, 아프리카계 미국인 2.4%, 히스패닉 3.2%, 비히스패닉 1.6%, 불명 24.8%였다. 또 AI 관련 박사 학위 수료자 가운데 여성 비율은 불과 18%라고 한다.
다음은 중국이 AI 논문 인용에서 미국을 추월했다는 것. 중국 과학 연구는 눈부신 발전을 거듭하고 있으며 2019년 12월에는 화학 논문 발표자 수에서 중국이 미국을 앞질렀다고 한다. 또 중국은 논문 인용 수에서 미국을 앞선 것. 하지만 지난 10년간을 보면 미국은 중국보다 훨씬 많은 AI 관련 논문을 발표하고 인용 수가 월등히 많은 것으로 알려졌다.
다음은 미국 AI 관련 박사 과정 수료자 대부분은 해외 출신으로 졸업 이후 미국에 체류하고 있다는 것. 북미 AI 관련 박사 과정 수료자 중 유학생 비율은 2019년에도 계속 증가하고 있어 64.3%에 도달했다. 이 수치는 2018년보다 4.3% 증가한 것이다. 또 그 중에서도 81.8%가 졸업 이후에도 미국에 체류하고 있으며 불과 8.6%만 미국 국외에서 취업한다고 한다.
7번째는 감시 기술은 빠르고 저렴해지면서 점점 유비쿼터스화된다는 것이다. 대규모 감시에 필요한 기술은 급속하게 발전해왔다. 모니터링에 사용하는 이미지 분류와 얼굴 인식, 동영상 분석, 음성 인식 등 기술은 모두 2020년 큰 발전을 이뤘다.
감시 관련 기술 중 대표적인 얼굴 인식 기술은 인간 얼굴 뿐 아니라 여생 동물이나 가축 개체 식별에도 사용할 수준으로 진화하고 있다. 한편 IBM은 얼굴 인식 시장에서 철수를 표명하고 미국 대도시에서 얼굴 인증 시스템 도입이 금지되는 등 개인 정보 보호 측면에서 큰 우려를 활보하고 있다.
8번째는 AI 윤리는 벤치마킹이나 합의가 결여되어 있다는 것이다. 많은 연구 그룹이 AI 윤리 영역에서 질적 또는 규범적 성과를 만들어내고 있다. 하지만 이 분야는 일반적으로 기술 개발에 관한 더 광범위한 사회적 논의와 기술 자체 개발과의 관계를 측정 혹은 평가하는 벤치마크가 없다고 지적하고 있다. 실제로 윤리적인 문제로 AI 개발 중단에 대해선 다양한 논의가 있으며 블로그 50만 건과 기사 6만 건을 분석한 결과 AI 윤리에 관한 게시물이 AI 관련 기사 중 가장 인기가 높은 것으로 밝혀지고 있다. 또 2020년 업계를 떠들썩하게 한 AI 윤리에 관한 기사로는 로마 카톨릭 교회 프란체스코 교황이 마이크로소프트, IBM과 공동으로 발표한 AI 윤리에 관한 로마의 호소나 구글 윤리적 AI팀 기술 리더를 맡던 팀니트 게브루 박사 해고 사례 등을 들 수 있다.
9번째는 AI는 미 의회 주목을 받고 있다는 것이다. 2019년 1월부터 2021년 1월까지 진행되어 온 제116회 의회는 2017년 1월부터 2019년 1월 사이에 이뤄지고 제115 의회와 비교해 AI에 관한 발언 수가 3배로 증가하고 있다.
그 밖에도 링크드인이 제공한 데이터에서 브라질, 인도, 캐나다, 싱가포르, 남아프리카공화국에서 2016년부터 2020년에 걸쳐 최고 수준 AI 기술이 채용된 것. 깃허브 저장소 수에서 AI 관련 소프트웨어 라이브러리 중 가장 인기가 높은 건 텐서플로우(TensorFlow), 아카이브(arXiv)에 발표된 AI 관련 논문 건수가 2015년 5,500건에서 2020년에는 3만 5,000건으로 증가했다. 관련 내용은 이곳에서 확인할 수 있다.