
미국 비영리 단체인 소사이어티포사이언스(Society for Science)가 개최하는 고등학교 3학년 학생을 대상으로 한 과학 콘테스트(Regeneron Science Talent Search)에서 미국 캘리포니아주에 거주하는 18세 마테오 파즈가 최우수상과 상금 25만 달러를 수상했다. 파즈는 기계학습 알고리즘을 사용해 새로운 천체 후보 150만 건을 식별하고 이를 심사를 거친 단독 저자 논문으로 발표한 과학적 공헌이 인정받았다.
파즈가 천문학에 관심을 갖게 된 건 초등학교 시절 어머니와 함께 캘리포니아 공과대학에서 열린 공개 천체 관측 강좌에 참가했을 때였다. STEM 교육에 힘을 쏟고 있는 지역 파사데나 고등학교에 진학한 파즈는 2022년 여름 열린 고등학생을 위한 천문학 연구 프로그램(Planet Finder Academy)에서 다시 캘리포니아 공과대학을 방문했다.
학생 지도를 담당한 캘리포니아 공과대학 적외선 처리 분석 센터(IPAC) 천문학자 데이비 커크패트릭은 처음 미항공우주국 나사(NASA) 광시야 적외선 탐사기(NEOWISE)가 수집한 데이터 극히 일부를 사용해 변광성을 몇 개 찾아보라고 권했다. 그는 탐사기가 10년 이상에 걸쳐 수행한 모든 탐지 데이터의 행 수는 2,000억 행에 육박했다며 하늘 일부를 촬영해서 변광성을 찾을 수 있는지 시도해 보라고 했는데 그렇게 하면 천문학 커뮤니티에 수작업으로 새로운 걸 발견했다고 보고할 수 있기 때문이라고 말했다.
하지만 이런 대규모 규칙적인 데이터는 AI 전문 분야라는 걸 깨달은 파즈는 수학 지식을 동원해 기계학습 알고리즘을 구축했다. 천문학자로부터 배운 천체물리학 지식을 통합해 천체 밝기에서 미묘한 변화를 포착하는 신호 처리 모델을 만들었다. 이렇게 개발된 AI인 VARnet은 기존 천체를 사용한 검증 데이터세트 테스트에서 높은 정확도를 보였을 뿐 아니라 천체당 평균 52마이크로초라는 고속 처리를 실현했다.
파즈는 VARnet에 NEOWISE 데이터세트를 처리하게 해서 미지의 초대질량 블랙홀이나 탄생 직후 별, 초신성 등 새로 발견된 천체와 천문 현상 150만 건을 식별했다. VARnet은 천문학자가 유사 데이터를 분석하는 데 사용할 수 있을 뿐 아니라 시간적인 데이터 변화가 중요한 다른 분야 연구에도 응용할 수 있는 가능성을 지니고 있다. 파즈는 자신이 구현한 모델은 천문학에서의 다른 시간 영역 연구, 아마도 시간적인 형식으로 데이터가 얻어지는 모든 연구에 활용할 수 있을 것이라며 예를 들어 주식 차트 분석에도 관련성이 있다고 생각하며 차트 분석에서도 마찬가지로 시계열별로 얻어진 데이터 주기적 요소가 중요해지는 경우가 있기 때문이며 또 주기적인 계절이나 주야의 사이클이 큰 역할을 하는 대기 오염 등 대기에 관한 연구에도 활용할 수 있다고 말했다.
파즈는 고등학교를 졸업할 때까지 캘리포니아 공과대학 직원으로 근무하며 NEOWISE와 나사 다른 우주 미션 데이터 관리와 처리 일을 하고 있다.
이번 콘테스트에선 파즈 외에도 네이티브 아메리칸 근병증이라는 희귀 유전자 질환 초파리 모델을 개발한 아바 그레이스 커밍스, 3-일양 하이퍼그래프(3-uniform hypergraphs)라는 오랜 수학 문제를 푼 오웬 장원 챈 등 고등학생 39명이 표창을 받았으며 180만 달러 이상의 상금이 수여됐다. 관련 내용은 이곳에서 확인할 수 있다.