연구자라면 특정 대상을 연구할 때 대량 데이터를 수집할 수 있다. 그런데 시드(Seed)라는 건강 관련 스타트업이 10만장에 이르는 대변 이미지를 수집해 대변 이미지 데이터베이스를 만드는 프로젝트를 실시하고 있다.
미국에선 5명 중 1명이 과민성 대장 증후군 같은 만성 장 질환에 시달리고 있다고 한다. 시드는 대변 이미지 데이터베이스를 구축해 이들에게 도움을 줄 시스템을 개발하려 한다. 시드 연구팀은 사용자가 자신의 건강을 관리할 수 있게 대변 이미지에서 사용자 건강 상태를 진단할 수 있는 도구를 제공할 예정이다.
시드 공동 설립자이자 CEO인 아라 카츠(Ara Katz)는 평소 대변을 원천으로 간주하는 건 아니지만 대변은 장 건강 상태를 직접 보여주는 증거라고 말한다. 시드 대변 이미지 데이터베이스 구축에 협력하려면 스마트폰으로 시드에 대변 이미지 전송 페이지로 들어간 다음 페이지 하단에 위치한 버튼(#GIVEaSHIT)을 누른다. 양식이 열리면 이메일 주소와 평소 대변을 보는 시간을 입력한다. 그런 다음 체크박스를 체크하고 사진 업로드 사진을 눌러 올리면 된다. 촬영한 사진은 개인을 식별할 수 있는 이메일 주소와 잠재적 메타 데이터로 분리하고 익명 상태에서 시드 연구팀에 이용된다.
시드 연구팀은 일반인으로부터 보내진 대변 이미지를 분석하는 전문의 소화기 전문의 7명을 통해 모든 대변 이미지를 진단하고 분류한다. 분류는 7가지 유형으로 이뤄진다고 한다. 이렇게 의사가 태그한 대변 이미지는 AI 모델 훈련에 이용된다. 자율주행 차량이 거리에 있는 나무나 고양이를 식별하기 위해 학습하는 것 같과 같은 교육 시스템을 사용해 인공지능이 의사처럼 대변 상태를 확인할 수 있도록 하려는 것이다.
대변 데이터베이스 작성 프로젝트는 일반적으로 구하기 힘든 대량 대변 이미지를 오픈소스화해 학술 목적으로 도움이 되도록 하는 게 궁극적 목적이다. 데이터베이스 구축 프로젝트에 협력하는 한 전문가는 만성 잘 질환을 안고 있는 사람은 뭘 먹으면 좋을지 얼마나 운동하면 좋을지 선택에 고민을 한다면서 대변 이미지 데이터베이스를 구축하고 환자가 집에서 상태를 모니터링할 도구를 개발하는 게 중요하다고 말한다. 관련 내용은 이곳에서 확인할 수 있다.