컴퓨터비전과 테슬라 조립라인 자동화

지난 2017년 테슬라는 모델3를 매주 5,000대씩 생산하겠다는 목표를 발표했다. 우려가 나왔지만 엘론 머스크는 로봇 조립 라인이 생산 속도를 높이고 비용을 낮출 방법이 될 것이라고 호언장담했다. 1년 반이 지난 2018년 4분기 기준으로 테슬라는 9만 1,000대를 출하하고 있다. 하지만 생산 대수 증가는 엘론 머스크가 당초 자동화 조립 라인 구상으로 해결할 수 없었다.

자동화가 제대로 안 된 이유에 대해 엘론 머스크는 한 가지 과제를 말한다. 바로 로봇 비전(컴퓨터비전이라고 생각하면 된다)이다. 다시 말해 조립라인에 있는 로봇이 행동을 결정하기 위한 대상으로 뭘 보는지 제어하는 소프트웨어를 말한다. 불행하게도 당시 조립라인에 있던 로봇은 볼트와 너트 같은 물건이 예기치 않은 방향으로 향하고 있는지 또 자동차 프레임 사이 복잡한 작업을 처리할 수 없었다. 이런 문제가 발생할 때마다 조립라인은 멈췄다. 결국 수많은 조립 공정에서 로봇을 인간으로 대체하고서야 훨씬 쉽게 문제를 해결하는 꼴이 되어버렸다.

로봇비전의 포괄적 명칭이라고 할 수 있는 컴퓨터비전은 곳곳에 존재하는 다양한 산업을 아우르려는 AI 기술과 혁신적 응용 프로그램 사이의 국경이라고도 할 수 있다. 이 분야에서 이뤄지는 진보는 인상적인 수준이다. 엘론 머스크의 자동차 조립라인 실현에 필요했던 요소도 나타나기 시작했다. 핵심은 컴퓨터와 로봇이 현실 세계에서 발생할 볼트와 너트 같은 예상치 못한 사건 대부분을 안정적으로 처리할 수 있어야 한다는 것이다.

컴퓨터비전이 전환기를 맞은 건 지난 2012년 CNN(Convolutional Neural Networks)을 적용하면서다. 2012년 이전까지만 해도 컴퓨터비전 솔루션은 알고리즘을 수동으로 정의한 규칙 세트와 이미지 특징을 비교적 효율적으로 수학적으로 설명하려는 시도 정도였다. 이런 건 인간이 선택하고 컴퓨터비전 연구와 결합해 자전거나 매장, 얼굴 같은 개체를 인식할 수 있게 특정했다.

하지만 머신러닝이 부상하고 인공신경망 기술을 접목하면서 이런 모든 게 바뀌었다. 이미지 특징을 자동으로 읽어 내고 학습할 수 있는 수많은 학습 데이터를 활용해 알고리즘 개발이 가능하게 된 것이다. 이를 통한 실제 효과는 크게 보면 첫째 솔루션이 훨씬 더 강력해졌다는 것과 둘째 뛰어난 솔루션을 만드는 게 고품질이면서 대량 학습 데이터에 의존하게 됐다는 것이다.

요즘은 GAN(Generative Adversarial Networks) 같은 새로운 방식을 통해 고품질 컴퓨터비전 모델 개발에 필요한 학습 데이터량과 수집에 필요한 시간이나 노력을 크게 줄일 수 있게 됐다. 이런 방식을 통해 AI는 훨씬 높은 비율로 빠르게 예외 사례도 식별을 해낸다. 인간은 이런 예외 사례를 평가하고 해결책을 재검토할 수 있다.

이런 새로운 접근 방식은 적용성과 견고성, 신뢰성 관점에서 컴퓨터비전의 영역을 급속하게 확장시켜주고 있다. 엘론 머스크가 고통 받았던 생산 과제를 해결할 수 있을 뿐 아니라 수많은 중요한 응용 프로그램에서 경계를 확대하게 될 것이다.

예를 들자면 생산 자동화, 얼굴 검출, 의료 이미징 분야, 운전자 지원이나 자동화, 농업, 부동산 정보 등을 들 수 있다. 이런 진보를 생각해보면 엘론 머스크의 생각 자체는 틀렸다고 할 수 없게 될 날이 올 것이다. 단순히 이 같은 비전을 1∼2년 너무 빨리 선행했을 뿐일지도 모른다. AI와 컴퓨터비전, 로봇은 모두 정확성과 신뢰성, 효율성의 전환점에 다가서고 있다.