테크레시피

AI와 기계학습 기반…지식 그래프의 역사

인터넷 검색과 기계학습에 필수적인 지식 그래프(Knowledge Graphs)는 그래프 구조로 다양한 지식을 연결하고 데이터를 연계해 지식 탐색과 고도화된 분석을 실행할 수 있게 한다.

지식 그래프 개념은 시맨틱 웹, 데이터베이스, 자연어 처리, 기계학습 등 여러 연구 분야에서의 과학적 발전에서 비롯됐다. 지식 그래프는 여러 분야 아이디어와 기술에 대한 이해를 심화하는 데 중요하지만 지식 그래프 기원에 대한 역사적 배경이나 개념을 제대로 이해하지 못한 이들이 많다.

지식 그래프 핵심 개념은 지식을 도식으로 표현한다는 아이디어다. 예를 들어 개나 소 같은 단어는 동물이라는 단어와 이다(is)로 연결되며 소와 풀은 먹는다라는 말로 연결되는 것처럼 단어를 의미적으로 연결해 관리한다. 이 아이디어는 기원전 350년경 아리스토텔레스가 제안한 시각적 추론 형식까지 거슬러 올라간다. 과학자에 의해 도식적 추론에 관한 연구가 깊어진 시기는 19세기경으로 대표적인 인물로는 실용주의 창시자인 찰스 샌더스 퍼스와 분석 철학의 아버지로 알려진 고틀로프 프레게가 있다. 지식을 도식적으로 표현하는 아이디어는 수학, 철학, 언어학, 도서관학, 심리학 등 여러 분야와 관련이 있다.

글에선 지식 그래프 역사를 설명하기 위해 먼저 디지털 시대 도래에 대해 언급한다. 1955년부터 1956년 사이 세계 첫 인공지능 프로그램인 로직 시어리스트(Logic Theorist)를 개발한 과학자는 1957년 제너럴 프라블럼 솔버(General Problem Solver)라는 범용 문제 해결 프로그램을 개발했다. 이후 1970년대까지 컴퓨터가 작동하는 시간 25%는 데이터 정렬에 사용됐으며 큰 공간에서 지식과 추론을 탐색하는 시도가 이뤄졌다. 대표적인 사례로는 다익스트라 알고리즘이 있다.

또 구조화되지 않은 문서에서 정보를 검색하는 방법도 그 시기에 발전한 중요한 요소 중 하나다. 미국 컴퓨터 과학자인 버트람 라파엘이 1964년 개발한 의미 정보 검색용 컴퓨터 프로그램은 대화 문장을 포맷팅해 문장에서 의미를 추출하는 시스템을 구축했다. 1950년대부터 1960년대 사이에는 대규모 데이터를 저장할 메모리와 데이터를 관리하는 시스템에 대한 아이디어가 크게 발전했다.

1970년대에는 산업계에서 컴퓨터가 널리 채택되면서 애플과 마이크로소프트 같은 기업이 설립됐다. 또 데이터 처리 시스템이 등장하고 스토리지와 처리 능력이 증가하면서 대량 데이터를 관리할 필요성이 커졌다. 관계형 데이터베이스 관리 시스템(RDBMS)이 등장했으며 이는 데이터를 표 형식으로 모델링해 데이터 검색과 수정이 가능하게 했다.

1980년대에는 개인용 컴퓨터가 유행하며 컴퓨팅 기술이 산업에서 가정으로 확산됐다. 복잡한 데이터를 처리하는 기술이 발전함에 따라 그래프에 대한 연구도 주목받기 시작했다. 1988년 데이비드 하렐이 개발한 하이그래프는 관계를 시각적 구조로 형식화하는 방식으로 현대 산업 애플리케이션과 철학적 연구에도 사용되고 있다.

지식 그래프라는 용어가 처음 등장한 건 1987년으로, 루네 로날드 바커가 논문에서 제시한 아이디어는 1990년대에 연구가 심화됐고 2000년대 이후에는 널리 보급되기 시작했다.

1990년대에는 2가지 큰 사건이 발생했다. 첫째는 월드 와이드 웹(WWW)의 등장으로 누구나 정보를 게시하고 열람할 수 있는 공간이 탄생했다. 둘째는 사회 다양한 측면이 디지털화되면서 종이로 관리하던 데이터를 컴퓨터로 관리하게 됐다. 이 과정에서 빅데이터 시대가 시작됐고 지식과 데이터를 저장하고 관리하는 새로운 형식이 필요하게 됐다.

2000년대에는 전자상거래와 SNS가 폭발적으로 증가했으며 인공지능과 딥러닝이 도입되기 시작했다. 구글과 아마존 같은 기업은 방대한 데이터를 처리하기 위한 인프라를 구축했다. 2012년 구글은 구글 지식 그래프라는 제품을 공개해 데이터를 연계하고 검색 결과를 확장하는 시스템을 도입했다. 이로 인해 지식 그래프는 점차 일반적인 개념이 됐다.

지식 그래프 개념은 고대부터 존재했지만 적절한 기술과 시점이 맞아떨어졌을 때 완성됐다. 지식 그래프 발전 과정을 통해 새로운 연구 가능성을 제시했다고 할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독

Most popular