테크레시피

구글이 만든 세계 최대 데이터셋

2016년 구글은 머신러닝을 위한 데이터세트 오픈 이미지(Open Images)를 처음 공개한 바 있다. 이어 오픈 이미지 데이터셋 V5(Open Images Dataset V5)를 구글이 새로 공개했다.

머신러닝은 학습을 할 때에도 방대한 데이터를 필요로 하기 때문에 구글은 2018년 이미지 데이터 세트인 오픈 이미지 V4(Open Images v4)를 출시했다. 오픈 이미지 V4는 이미지 900만장에 라벨과 바운딩박스를 부여한 것이다. 오픈 이미지 v4는 600가지 범주로 구분된 개체에 대해 1,540만개 바운딩박스가 부착되어 있으며 30만개 이상에 달하는 이미지 관련 주석과 위치 주석이 붙은 세계 최대 데이터 세트였다. 오픈 이미지 데이터셋 v5는 최신 버전이다.

오픈 이미지 데이터셋 v5의 특징은 객체의 인스턴스를 위해 350가지 카테고리에 걸쳐 280만개 세분화 마스크를 갖췄다. 바운딩박스와는 달리 이 세분화 마스크는 개체가 존재하는 곳 밖에 인식하지 않는다. 세분화 마스크 오브젝트의 윤곽을 표시하고 공간적 확대를 세부에 이르는 특징이다. 무엇보다 과거 어떤 데이터 집합보다 다양한 카테고리 객체, 삽화를 포함하고 있다.

마스크는 수작업 드로잉보다 훨씬 효율적이고 IoU(Intersection-over-Union)에서 84%를 기록할 만큼 높은 정확도를 자랑하고 있다. 마스크 외에도 구글은 인간이 검증한 새로운 이미지 수준 레이블을 640만개 추가했고 이에 따라 2만 개 가까운 카테고리와 3,650만개 레이블을 제공하게 됐다. 또 검증과 테스트 세트 600개 카테고리에서 주석 밀도를 향상시키는 등 개체 탐지 모델의 정확도를 더 높이고 있다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사