바드(Bard)는 구글이 지난 2워 발표하고 3월 공개를 시작한 대화형 AI다. 구글이 이런 바드에 백그라운드에서 코드를 실행해 수학적 태스크나 코딩 질문, 캐릭터 라인 조작에 관한 프롬프트에 대해서 정확하게 응답할 수 있는 암묵적 코드 실행(implicit code execution) 기법을 도입했다고 발표했다.
암묵적 코드 실행 기술은 바드가 계산이 필요한 프롬프트를 감지하고 백그라운드에서 코드를 실행하는데 도움이 된다. 암묵적 코드 실행에 의해 15683615 소인수는 뭐냐거나 저축 성장률을 계산해달라거나 Lollipop라는 단어를 거꾸로 해달라는 등 지금까지 응답이 곤란했던 요구에 대해 정확한 답을 할 수 있게 됐다는 것.
구글에 따르면 일반적인 대규모 언어 모델은 예측 엔진과 같은 구조를 하고 있어 사용자로부터 지시를 받으면 사용자로부터 지시를 받으면 다음에 오는 단어를 예측해 응답을 생성한다고 한다. 따라서 대규모 언어 모델은 문장 생성 같은 창조적 태스크 실행은 뛰어나지만 추론이나 수학 분야에는 희소하다고 한다.
따라서 구글은 바드가 자동으로 코드를 생성하고 실행해 추론과 수학 능력을 향상시키는 암묵적 코드 실행을 도입했다. 구글은 이 접근법에 대해 심리학자 다니엘 카네만의 저서(Thinking, Fast and Slow)로 대표되는 인간 지능에서의 이항 대립에서 착안했다고 밝히고 있다. 구글에 따르면 인간은 빠르고 직관적이고 단순한 사고인 시스템1 사고와 천천히 노력을 거듭하는 시스템2 사고를 모두 사용하고 있다는 것. 시스템1 사고는 재즈 뮤지션에 의한 연주나 블라인드 터치가 대표적이다. 한편 시스템2 사고는 자릿수가 많은 나눗셈이나 악기 연주 방법을 배울 때 등에 이용되고 있다. 일반 대규모 언어 모델은 이 시스템1만 이용해 빠르게 문장을 작성하는 반면 복잡한 사고는 배제하고 있다. 만일 시스템1만을 이용해 복잡한 수학 문제에 답하려고 하면 복잡한 계산을 할 수 없고 처음 생각해온 적당한 숫자를 대답하는 것만으로 체재한 다고 되어 있다. 실제 수학적 계산을 할 때에는 시스템2 사고 방식으로 문제를 풀어야 하며 정형적이고 유연성과 창의성이 부족하지만 올바른 절차를 거쳐 적절한 답을 만들어내는 게 가능하다.
구글은 바드에 암묵적 코드 실행을 구현해 시스템1 기능과 시스템2 기능을 모두 갖춘 대화형 AI로 바드를 진화시켰다고 한다. 암묵적 코드 실행에선 논리적인 코드를 작성하는 것으로 응답이 가능하게 되는 프롬프트를 특정해 코드를 작성, 해당 코드를 백그라운드에서 실행해 그 결과를 이용해 정확한 답을 생성하는 게 가능하다.
구글은 암묵적 코드 실행 도입으로 구글 데이터세트 내에 있는 계산이 필요한 단어나 수학적 문제에 대한 바드 답변 정확도가 전통적으로 30% 향상됐다. 또 암묵적 코드 실행 도입으로 바드는 일반 대규모 언어 모델을 탑재한 챗GPT나 빙 AI 채팅 등 다른 대화형 AI 성능을 크게 웃도는데 성공했다고 한다.
한편 구글은 암묵적 코드 실행은 발전 단계에 있으며 바드가 사용자 질문에 적절히 대답하기 위한 코드를 생성하지 않거나 생성한 코드가 잘못됐거나 코드를 생성한 걸 대답에 사용하지 않을 수도 이싿고 밝히고 있다. 하지만 구글은 코드 생성에 의해 구조화된 논리적 응답을 할 수 있게 됐다는 건 바드를 더 편리한 AI로 만드는 중요한 단계라고 강조하고 있다.
또 바드 업데이트로 동물 보호 시설 자원봉사 등록용 테이블을 작성해달라는 요구를 받아도 구글 스프레드시트에 직접 생성 결과를 익스포트할 수 있게 됐다고 발표하고 있다. 관련 내용은 이곳에서 확인할 수 있다.