미래에 전직원 80%가 AI 영향을 받는다는 연구 결과가 나타나고 있으며 이미 일러스트레이터나 게임 개발자가 AI에게 일을 빼앗겼다고 호소하고 있으며 앞으론 더 전문성이 높은 분야에서도 AI 활용이 중요한 스킬이 될 것으로 예상되고 있다. 위스콘신대학 매디슨 등이 오픈AI 대화형 AI인 챗GPT를 사용한 재료공학 연구에서 큰 성과를 올렸다고 보고했다.
연구팀은 AI는 복잡하고 시간이 많이 걸리는 작업을 점점 지원할 수 있게 왔다고 말한다. AI를 이용해 연구를 효율화할 수 없는지 고민하던 연구팀은 같은 재료과학자가 고생하고 있는 논문을 읽고 데이터를 얻는 작업에 챗GPT가 도임이 될 것이라고 생각했다. 연구팀에 따르면 재료과학자는 데이터세트에 작은 숫자를 추가하기 위해서도 긴 연구 논문을 다운로드하고 구석구석 읽는 경우가 많다고 한다. 따라서 이런 시간에 걸리는 작업을 논문을 읽고 정보를 제공하는 게 능숙한 AI에 맡겨보기로 했다.
하지만 어떻게 챗GPT가 강력하지만 논문 전체 텍스트에서 데이터를 찾아 추출하도록 요청하는 건 여전히 부담스럽다. 따라서 연구팀은 챗GPT에 한 문장씩 확인하고 여기에 필요한 데이터가 포함되어 있는지 여부를 판단하도록 요청한 다음 표 형식으로 데이터를 출력하도록 지시했다. 이렇게 하면 인간 과학자가 표와 문장을 보고 제대로 관련성이 있는 데이터를 추출할 수 있는지 확인할 수 있다.
이 기술은 90% 정확성을 자랑했다. 연구팀은 챗GPT를 이용해 금속 유리 임계 냉각 속도 데이터베이스를 구축하는데 성공했다. 이 성과는 아카이브에 공개되어 있다.
AI로 논문을 읽는 수고를 99% 줄일 수 있었지만 새로운 정밀도 향상과 완전한 자동화를 위해 다음 방법에 임했다. 이게 AI에 효율적으로 대답을 생성하기 위해 질문이나 지시를 조립하는 프롬프트 엔지니어링이다.
연구팀은 프롬프트 엔지니어링을 이용해 AI가 추출한 데이터를 AI로 검토하고 잘못된 가능성을 찾는 일련의 질문을 고안했다. 이렇게 데이터 재확인을 반복해 챗GPT는 거의 모든 경우 잘못된 데이터를 식별할 수 있게 됐다. 이 방법(ChatExtract)은 대부분 인간에 필적하거나 인간을 능가할 가능성도 있는 90% 이상 적합률과 재현률을 내는데 성공했다고 한다. 연구팀은 이를 논문에 정리해 지난 3월 공표했다.
연구팀은 이 방법에 대해 가장 중요한 건 AI가 잘못된 데이터를 식별할 수 있다는 점이라며 또 많은 수고와 깊은 지식이 필요하지 않다는 점도 중요하다면서 지금은 챗GPT 같은 도구 덕분에 이런 능력이 크게 향상됐다고 밝히고 있다. 연구팀은 AI가 대학원생이나 과학자 등 연구자를 대체하는 게 아니라고 말한다. 오히려 AI라는 도구를 이용해 연구자는 지금까지 시간이나 자금, 인원 부족으로 할 수 없던 프로젝트를 진행할 수 있다는 것이다.
인공지능과 과학 미래에 대해 연구팀은 지금까지 구를과 기타 검색 도구에서 논문과 자료를 찾아 읽고 데이터를 추출해 특정 분야를 연구했지만 지금은 대규모 언어 모델을 이용해 어떤 것에 대한 정보를 수집하고 이번에 짜낸 것과 같은 기술을 이용해 몇 시간 내에 데이터베이스를 구축할 수 있다며 연구 방향성이 흔들릴 수 있는 정보 수집이 AI로 가능해졌다고 밝히고 있다. 관련 내용은 이곳에서 확인할 수 있다.