테크레시피

난해한 논문, 이젠 AI가 알기 쉽게 요약?

MIT 연구팀이 전문 학술지에 게재되는 난해한 논문을 읽어 과학적 배경이 없는 독자도 알기 쉽게 문장을 요약해주는 AI를 발표했다.

MIT 대학원생인 루멘 단고브스키(Rumen Dangovski)와 리징(Li Jing)와 물리학 교수 마린 소랴치치(Marin Soljačić) 연구팀은 전문적인 논문을 한두 문장 정도로 요약해주는 AI를 개발했다. AI가 생성할 수 있는 문장은 상당히 짧기 때문에 실제 과학 작가가 만드는 것 같은 기사를 만들 수는 없다. 하지만 많은 논문을 읽을 때 가볍게 확인할 내용을 예비 파악하는 데에는 도움이 될 수 있다.

연구팀은 원래 물리학적 문제를 해결하는 걸 목표로 AI를 활용하려 했다. 논문 요약 등 처리에 초점을 맞춘 건 아니다. 하지만 연구팀은 개발한 방법이 물리학 분야 뿐 아니라 자연어 처리를 포함한 다른 분야에서도 같은 방법을 적용할 수 있다는 사실을 알게 됐다.

일반 신경망은 많은 사례에 대한 패턴을 학습해 발전한다. 예를 들어 사진에 찍힌 개체를 식별하거나 사진과 음성에서 특정 물건을 추출하는 시스템에 신경망이 널리 활용된다. 반면 신경망은 긴 일련 데이터에서 정보를 선택하고 연결하기는 쉽지 않다. 이 능력은 오랜 논문에서 필요한 정보를 찾고 요약하는 과학 작가 같은 직업에 요구되는 기술 중 하나다. LSTM 네트워크 같은 방법이 문제를 해결하기 위해 쓰이지만 자연어 처리를 실용적인 수준까지 이르게 하지는 못했다.

연구팀은 기존 신경망에 사용되던 행렬 곱셈을 기반으로 시스템이 아니라 다차원 공간에서 회전하는 벡터를 기반으로 대체한 시스템을 고안했다. 이 시스템은 RUM(rotational unit of memory)이라고 명명했다.

RUM은 신경망이 요소를 기억하는 걸 돕고 더 정확하게 요소를 기억하는 데 효과적이라고 한다. RUM은 원래 빛 행동 같은 복잡한 물리학적 문제를 해결하기 위해 고안했지만 연구팀은 RUM이 자연어 처리 같은 다른 분야에서도 유용하다는 걸 알게 됐다는 것이다.

자연어 처리에서 RUM은 문장 중 등장하는 각각의 단어를 다차원 공간에서 벡터로 나타낸다. 문장에서 단어가 특정 길이와 특정 방향을 가진 선이 되는데 수천 개에 이르는 차원을 지닌 이론적 공간에 문장이 표시되며 최종 벡터가 문장을 출력한다.

연구팀은 이렇게 LSTM 네트워크를 이용한 요약 AI에 아메리카 너구리회충증(Baylisascariasis)이라는 동물에 감염되는 회충의 일종에 관한 논문을 읽고 요약하게 했다. 이 요약은 반복적이어서 실용적이라고 할 수 있는 수준은 아니다.

또 RUM을 이용해 같은 논문을 읽고 출력하게 하자 이 요약은 LSTM 네트워크를 이용한 AI 요약보다 훨씬 읽기 쉽고 반복적인 부분도 없었다고 한다.

전문가들은 AI가 시공간적으로 떨어진 관련 요소를 연결하는 건 근본적이고 중요한 문제라고 지적하고 이번 연구가 모든 문제를 해결할 수 있는 건 아니지만 질의응답이나 텍스트 요약, 연상 등 작업에 대한 긍정적 결과를 보여주고 있다고 밝히고 있다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사