테크레시피

인스타그램 10억개 이상 이미지 활용한 이미지 인식 모델

페이스북이 3월 2일 인스타그램에 올라온 10억 개 이상 이미지를 이용해 학습한 이미지 인식 모델인 SEER을 발표했다. 또 SEER 개발에 사용한 자기 감독 학습을 가능하게 해주는 라이브러리인 VISSL도 동시에 공개했다.

기존 AI를 이용한 화상 인식 모델 대부분은 감독 학습이라는 방식을 채택해 수동으로 분류된 데이터세트를 이용한 학습을 필요로 한다. 하지만 이번 페이스북이 발표한 SEER은 수동 분류된 데이터세트를 필요로 하지 않는 자기 감독 학습을 채택하고 있으며 인스타그램에 올라온 10억 개 이상 이미지를 이용해 높은 이미지 인식 정확도를 획득하는데 성공했다는 것.

이미지넷(ImageNet)을 이용한 화상 인식 능력 측정 시험 점수를 SEER과 구글 등 다른 곳이 개발한 인식 모델과 비교하면 SEER은 이미지 인식 정확도가 기존 이미지 인식 모델을 능가한다고 한다.

페이스북은 SEER 자기 감독 학습이 실제 작업에 유용하다는 걸 보여줬다며 SEER은 유연하고 정확하고 적응력 잇는 컴퓨터 비전 모델을 구축하는 길이라고 밝히고 있다. 또 SEER 개발에 사용한 라이브러리인 VISSL 소스코드도 공개했다. 이에 따라 VISSL을 AI 연구자와 공유해 의견 교환을 하고 자기 감독 학습에 관한 연구가 가속화될 것으로 기대한다고 밝혔다.

또 SEER 개발에 인스타그램에 올라온 이미지 10억 개 이상이 사용됐다고 밝혔는데 보도에선 인스타그램 사용자가 자신의 이미지가 AI 연구에 이용되고 있다는 걸 알면 놀랄 것이라는 지적이 나오기도 한다. 이런 불안에 대해 페이스북 AI 연구소 측은 인스타그램에 올라온 이미지는 공유하지 않는다며 인스타그램 사용자 개인 정보를 보호하고 있다고 주장하고 있다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독