테크레시피

이미지 인식 모델 단점 극복 위한 新데이터세트

인공지능을 이용한 화상 인식 모델은 사진이나 영상에 비치는 물체를 정확하게 식별하는 걸 목적으로 한다. 자율주행 자동차 등 여러 분야에 응용하기 위한 것. 예를 들어 자율주행차라면 이미지 인식 모델의 물체 인식 정확도는 자율주행차의 안전성과 직결되는 만큼 모델 학습에 사용하는 데이터세트는 중요한 역할을 맡는다. MIT와 IBM 연구팀은 다양한 물체를 포함한 이미지 인식 모델을 위한 데이터세트인 오브젝트넷(ObjectNet)을 만들었다.

오브젝트넷은 이미지 인식 모델용 데이터세트다. 이미지 인식 모델 학습에 이용하는 학습 세트를 포함하지 않고 모델 정확성을 검증하기 위한 테스트 세트로 이뤄져 있다. 수록한 이미지 테스트 세트 수는 이미지넷(ImageNet)과 같은 5만장이다.

이미지넷은 플리커 등 사진 공유 서비스를 통해 수집한 이미지를 포함한 데이터 집합이었다. 하지만 오브젝트넷은 프리랜서 사진작가 등에게 유료로 의뢰해 촬영한 사진 데이터를 정리한 데이터세트다. 물체를 일부러 옆으로 기울이거나 보통은 촬영하지 않는 이상한 각도에서 촬영하거나 일부러 지저분한 방에서 촬영해 이미지 인식이 어려울 것 같은 이미지를 모은 것이다.

오브젝트넷은 지저분한 방안에 의자가 놓여져 있고 의자 뒤쪽을 찍은 사진 등 인간도 판단하기 어려울 것 같은 사진을 담고 있다. 이미지 인식 모델은 데이터세트를 이용해 딥러닝으로 이미지 인식 정확도를 높여간다. 하지만 이미지넷 같은 방대한 데이터 세트도 안에 포함된 이미지에 의자 뒷면이나 쓰러진 의자 같은 이미지는 존재하지 않는다는 맹점이 있다. 따라서 이미지넷 같은 기존 데이터세트에서 학습한 이미지 인식 모델은 의자 뒷면이나 쓰러진 의자 등 불규칙한 경우가 발생하면 이미지를 정확하게 인식할 수 없다.

또 오브젝트넷은 다른 데이터세트와 달리 훈련 세트를 포함하고 있지 않다. 데이터세트 대부분은 모델을 학습하는 학습, 정확도 검증을 위한 테스트 세트를 따로 준비하고 있다. 하지만 이들 2개는 유사성이 높기 때문에 정확하게 정밀 검증을 할 수 없는 경우가 있다고 한다.

실제로 이미지넷과 오브젝트넷에 수록된 이미지 인식 테스트를 실시한 결과 이미지넷은 이미지를 97%까지 정확도로 인식하는데 성공했지만 오브젝트넷은 50∼55% 정도로 감소했다. 이는 물체 뒷면 등 이미지 인식 모델을 정확하게 인식하지 않은 것으로 이미지 인식 모델 아키텍처는 물체 뒷면이나 기발한 각도를 인식하는 개념을 포함하고 있지 않다는 걸 말해준다. 이런 점에서 이미지 인식 모델에 더 똑똑한 알고리즘이 필요하다는 것이다.

전문가들은 알고리즘이 현실 세계에서 얼마나 잘 작동하는지 알고 싶다면 편향이 없고 지금까지 본 적이 없는 듯한 이미지로 이미지 인식 모델을 테스트해야 한다며 오브젝트넷이 이미지 인식 모델을 만드는 대신 검증하기 위해 만들어진 데이터 집합이라고 설명했다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독