테크레시피

언어‧이미지‧음성 등 다분야 자가 학습형 AI 개발했다

페이스북을 운영하는 메타가 모든 분야에 적응할 수 있는 자기 학습형 AI인 데이터2백(Data2vac)을 개발했다고 발표했다.

메타에 따르면 2022년 시점 개발되고 있는 AI 대부분은 인간이 미리 붙인 정답과 라벨에 근거해 학습해간다. 하지만 AI에 배우게 하려는 모든 것에 대해 인간이 미리 라벨을 준비하는 건 실질적으로 불가능한 문제다. 현재 연구가 초점을 맞추고 있는 건 인간이 정답, 부정해를 가르치지 않아도 스스로 학습하는 AI 개발이다.

메타에 따르면 스스로 학습해주는 AI 개발이라는 목적이라도 언어와 화상, 음성이라는 분야로 인해 접근 방식은 크게 다른 상태가 계속되고 있었다. 이런 상황 속에서 새롭게 메타가 개발한 데이터2배근 다른 분야에서도 동일하게 기능하는 자기 학습형 AI다. 화상이나 문장, 음성이라도 신경망 레이어에 초점을 맞춰 단일 알고리즘으로 다른 유형 입력 데이터를 탐구한다.

구체적인 트레이닝 방법은 먼저 AI를 교사 측, 학생 측 2개 역할로 나누고 교사 측에는 개 이미지라면 개 얼굴 부분을 흑색으로 하는 등 일부 작업을 할 수 있다. 이어 학생 측에는 해당 부분을 예측하게 묻는 작업을 실시해 이 반복으로 자기 학습을 깊게 해준다는 것이다.

데이터2백은 이미지 인식에 관해선 기존 알고리즘보다 뛰어난 성적을 얻을 수 있다고 한다. 음성 검출에 관해선 경쟁 대상(wav2vec 2.0, HuBERT)에 패했지만 자연어 이해에선 경쟁 모델(RoBERTa)과 거의 동등했다고 한다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독

Most popular