미항공우주국 나사(NASA)와 마이크로소프트가 100페타바이트에 달하는 방대한 나사 관측 데이터를 대화형 AI 인터페이스를 통해 누구나 접근할 수 있도록 하는 프로젝트인 어스 코파일럿(Earth Copilot)을 발표했다. 이 프로젝트는 현재 실험적인 단계에 있으며 장기적으로는 일반에 공개될 예정이라고 한다.
나사 위성은 매일 지구를 공전하며 산불 모니터링에서부터 기후 변화 추적에 이르기까지 다양한 지구과학 데이터를 수집하고 있다. 이 데이터는 과학적 발견, 정책 결정, 농업, 도시 계획, 재난 대응 등 다양한 분야에서 활용될 수 있다. 하지만 기존에는 데이터 형식이나 지리 공간 분석에 대한 전문 지식이 필요하여 일부 연구자와 과학자만이 접근할 수 있었다.
이 문제를 해결하기 위해 나사는 데이터 접근 민주화를 위해 노력해왔다. 그리고 마이크로소프트와 협력해 개발된 어스 코파일럿은 애저 오픈AI 서비스(Azure OpenAI Service)를 활용해 복잡한 데이터를 쉽게 다룰 수 있도록 한다. 예를 들어 과학자가 태풍의 과거 데이터를 분석해 예측 모델을 개선하거나 정책 입안자가 산림 파괴 패턴을 연구해 환경 규제를 실행하는 데에 도움을 줄 수 있다. 이를 통해 전문 지식이 부족한 이들도 데이터를 활용할 수 있다.
어스 코파일럿은 종합적인 애저 서비스 제품군을 기반으로 구축됐으며 기계 학습 기능, 데이터 분석 기능, 확장 가능한 클라우드 인프라를 결합하고 있다. 애저 오픈AI 서비스를 시스템 핵심으로 사용해 강력한 AI 모델과 자연어 처리 기능을 제공하며 개발자는 이런 기능을 응용 프로그램에 통합할 수 있다.
어스 코파일럿은 나사 기존 데이터 분석 플랫폼인 VEDA(Virtual Earth Data Analysis)와 통합되어 있으며 100페타바이트 이상 대규모 데이터 세트를 효율적으로 처리할 수 있도록 설계됐다. VEDA 대시보드를 통해 사용자는 지리 공간 데이터에 대한 복잡한 질의를 실행할 수 있다.
데이터 처리 측면에서 어스 코파일럿은 위성 센서와 장비에서 수집한 다양한 데이터를 처리할 수 있도록 설계됐다. 예를 들어 대기 조건, 토지 피복 변화, 해양 온도와 같은 데이터를 통합적으로 처리할 수 있다. 또 새로운 위성이나 관측 장비가 추가되더라도 시스템은 이를 유연하게 처리할 수 있도록 확장 가능한 아키텍처를 채택했다.
마이크로소프트 클라우드 솔루션 아키텍트에 따르면 어스 코파일럿은 데이터 검색, 탐색, 분석 과정을 몇 초 안에 완료할 수 있도록 최적화되어 있다.
현재 어스 코파일럿은 데이터 정확성과 신뢰성을 확보하는 데 초점을 맞춘 실험적인 단계에 있으며 데이터나 결과물이 오용되지 않도록 엄격한 평가 과정을 거치고 있다. 현재는 일부 과학자와 연구자에게만 공개된 상태다. 마이크로소프트와 나사는 어스 코파일럿이 나사 오픈 사이언스 이니셔티브(Open Science Initiative) 일환으로 과학 연구를 더 투명하고 포괄적이며 협력적인 방향으로 이끌겠다는 목표를 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.