테크레시피

1천만건 이상 연구 논문 지키려는 인터넷아카이브의 대처

온라인으로 공개되는 자연과학, 인문과학, 사회과가 등 다양한 분야 연구 논문은 웹사이트 폐쇄 등으로 온라인상에서 사라지고 쉽게 액세스할 수 없게 된 것도 많이 존재한다. 누구나 쉽게 연구 논문을 읽을 수 있는 환경을 지키기 위한 비영리 인터넷 아카이브는 웹에 있는 모든 연구 논문 저장을 목표로 한 연구 논문 아카이브에 주력하고 있다.

웹에 있는 연구 논문은 인터넷 아카이브 뿐 아니라 오픈 액세스 저널을 통해 무료로 온라인에서 열람할 수 있다. 이 연구 논문은 전 세계 어디서나 쉽게 접근할 수 있도록 되어 있기 때문에 많은 학생이나 연구자 연구를 지지해왔다.

하지만 오픈 액세스 저널 웹사이트 폐쇄 등을 통해 연구 논문을 열람하기 어려워졌다. 조사에 따르면 2000년부터 2019년 사이 오픈 액세스 저널 176개가 웹상에서 사라져 버렸다고 한다. 이런 웹사이트 폐쇄에 의한 콘텐츠 손실 문제를 해결하기 위해 조직된 게 인터넷 아카이브의 웨이백 머신이다. 사실 웨이백 머신에서만 볼 수 있게 된 연구 논문도 다수 있다고 한다.

2017년 인터넷 아카이브는 앤드류멜론재단, 칼레오스틴재단의 재정 지원 공용 액세스가 가능한 모든 연구 논문 저장에 초점을 맞춘 프로젝트를 시작했다. 이 프로젝트에서 인터넷 아카이브는 1996년 이후 웹상에서 공개된 1,480만 건 연구 논문을 대상으로 아카이브를 진행하고 있다. 웹상에서 사라진 논문은 해마다 증가하고 잇지만 그 이상으로 인터넷 아카이브는 수많은 연구 논문을 보관하는데 성공해 현재 910만 건 이상 연구 논문이 보관되어 있다고 한다.

인터넷 아카이브 측은 목표는 웹에 있는 연구 논문을 가능하면 많이 아카이빙하는 것이라면서 매일 발표되는 새로운 연구 논문 증가를 따라 잡고 웨이백머신의 방대한 웹 콘텐츠를 1996년까지 거슬러 올라가 쉽게 찾을 수 없는 콘텐츠를 찾을 수 있도록 하는 게 목표라고 밝혔다. 이어 웹상 연구 논문과 연구자료를 영구적으로 사용할 수 있도록 하고 싶다며 대규모 데이터세트를 포함해 새로운 방법으로 제공하기를 원한다고 덧붙였다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독