테크레시피

긍정적 강화가 로봇 학습 효율 높여준다

존스홉킨스대학 연구팀이 최근 발표한 논문은 좋은 로봇(Good Robot)이라는 제목으로 긍정적 강화에 의한 학습 가능성을 탐구하고 있다. 핵심은 로봇이 뭔가 바른 행동을 하도록 포상을 올리는 것이다. 잘못을 해도 벌을 주지 않고 로봇에 대한 포상은 일종의 점수 방식을 택한다. 일의 게임화 같은 형태로 제대로 하면 점수를 주는 식이다.

논문은 이 방법으로 훈련 시간을 줄일 수 있다고 말한다. 로봇은 높은 점수를 갖고 싶어 하며 최고의 보상을 얻을 수 있기 때문에 올바른 행동을 빨리 배우게 된다는 것. 지금까지 로봇이 100% 정확한 작업을 할 때까지 1개월이 필요했다면 이를 이틀까지 줄일 수 있었다는 설명이다.

로봇 학습 분야는 산업계에 큰 가능성을 쥐고 있다. 로봇이 처음부터 본질적으로 학습할 수 있도록 비밀을 밝히기 위해 수많은 여러 접근 방식을 취하는 이유 중 하나다. 물론 아직은 적목을 쌓거나 비디오 게임을 하는 등 초보적 작업 뿐이지만 앞으로는 더 복잡한 실제로 유용한 작업을 해낼 가능성도 있을 것으로 기대되고 있다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독