구글 AI 연구 부문인 구글 딥마인드(Google DeepMind)는 GNoME라는 AI 도구를 사용해 이론적으론 안정적이지만 실험적으로는 실현되지 않은 새로운 결정 구조를 220만 종 발견했다고 발표했다. 하지만 여러 연구자가 구글 딥마인드가 발표한 새로운 결정 구조를 분석한 결과 기존에 알려진 물질을 과도하게 확대 해석한 게 대부분이며 놀랄 만큼 새로운 화합물은 포함되어 있지 않다고 반박하고 있다.
안정적인 결정 구조는 현대 기술과 밀접한 관련이 있지만 분해되기 어려운 안정적인 결정을 얻기 위해선 수개월에 걸친 정밀 실험이 필요하다. 하지만 구글 딥마인드 연구팀은 새로운 재료 안정성을 예측해 신소재 발견 속도와 효율을 극적으로 향상시키는 딥러닝 도구 GNoME(Graph Networks for Materials Exploration)를 활용해 AI 분석으로 새롭게 220만 종에 이르는 결정 구조를 발견했다고 학술지 네이처 논문에서 주장했다. 220만 종은 지금까지 발견된 결정 구조보다 45배 이상이며 이 가운데 38만 종은 구조적으로 안정된 것으로 기대되는 만큼 구글 딥마인드는 이번 발견은 800년 분량 지식에 해당한다고 설명했다.
동시에 발표된 로렌스 버클리 국립연구소 연구진 별도 논문은 구글 딥마인드와의 협력으로 자신들의 AI 예측이 자율적 물질 합성에 어떻게 활용될 수 있는지 보여줄 수 있었다며 구글 딥마인드 발표를 지지했다. 연구진에 따르면 계산, 문헌 기록, 기계학습, 능동학습을 사용해 인간 개입 없이 연구를 수행한 자율형 실험실을 활용했으며 자율적 재료 발견을 위한 AI 기반 플랫폼 유효성을 입증했다고 주장한다.
하지만 캘리포니아 대학 산타바바라 캠퍼스 연구팀은 지난 4월 발표한 논문에서 구글 딥마인드와 버클리 국립연구소 논문을 분석한 결과 AI가 새로운 유형 재료를 발견하는 데 큰 가능성을 갖고 있는 건 분명하지만 220만 종에 달하는 새로운 결정 구조를 발견했다는 연구 결과는 과대 평가됐다고 주장했다.
연구진은 구글 딥마인드가 공개한 안정된 새로운 결정 구조 38만 종 중에서 무작위로 수백 개 샘플을 선택해 그 결정이 신뢰할 수 있는지, 유용한지, 새로운 것인지를 3단계로 테스트했다. 구글 딥마인드가 발견한 건 일반적인 재료를 가정한 게 아니라 어떤 유용성도 증명하지 않은 것이기 때문에 반드시 유용한 건 아니다. 그렇지만 이를 감안하더라도 무작위로 선정한 샘플은 어느 것도 충분한 기준을 충족하지 못했다는 설명이다.
논문에선 안정된 결정 구조 38만 4,870종 목록에는 놀랄 만한 새로운 화합물이 포함되어 있지 않았다며 새로운 결정 구조 대부분은 기존 소재를 조금 변형한 것일 뿐이라고 지적했다.
연구팀은 구글 논문은 물질과학자에게 실용적이고 유용한 기여를 한다는 측면에서 상당히 부족하다며 새로운 결정 구조가 특정 기능을 수행할 수 있는지는 특정 요구에 초점을 맞춰 가능성을 면밀히 검토해야 한다고 밝혔다 하지만 새 결정 구조 220만 종을 모두 검토하기는 어려우며 이번에 무작위로 일부를 검토했지만 안정된 결정 구조라 해도 새로움이나 유용성이 없었다고 덧붙였다.
또 프린스턴대와 유니버시티칼리지런던 연구자도 버클리 국립연구소의 자율실험실 발표를 분석한 결과 해당 연구에서 새로운 자료는 발견되지 않았다고 지적한다. 이들 역시 AI 주도 신소재 발견 프로세스가 유망하다는 점은 인정하면서도 적어도 현재 발표로는 큰 진전이 없으며 그런 맥락에서 발표되어서는 안 된다고 지적했다.
그 뿐 아니라 구글 딥마인드 논문에는 해당 분야 전문가뿐만 아니라 고등학생조차도 이해할 수 있을 정도로 명백한 난센스 예측 자료가 많이 포함되어 있다며 기본 품질 관리조차 이뤄지지 않은 것 같다면서 AI가 그런 화합물을 예측 결과로 내놓는 것 자체가 우려스러운 일이며 뭔가 잘못되고 있다는 걸 보여준다고 덧붙였다.
반론이 제기된 논문을 접한 후 구글 딥마인드는 자사는 GNoME 논문에서 행해진 모든 주장을 지지한다는 성명을 냈다. 관련 내용은 이곳에서 확인할 수 있다.