챗GPT 업그레이드한 빙도 데모에서 잘못된 답변을…

마이크로소프트가 발표한 챗GPT 업그레이드 버전 AI를 통합한 검색엔진이 빙에 대해 빙 데모에서 몇 가지 잘못된 답변이 이뤄졌다는 지적이 나왔다.

지난 2월 8일 마이크로소프트는 챗GPT 업그레이드 버전 AI를 통합한 새로운 빙과 엣지를 발표했다. 챗GPT 업그레이드 버전 AI가 통합되며 빙은 사용자와 상호 작용하면서 필요한 정보를 현명하게 요약하거나 사용자가 요구하는 정보를 읽기 쉬운 형태로 편집해 출력할 수 있다.

마이크로소프트는 2022년 3분기 결산 보고서에서 새로운 빙에게 의류 브랜드 갭(Gap) 요약을 요청했다. 그러자 빙은 동기간 갭 영업이익률이 5.9%였다고 출력했다. 하지만 실제 영업이익률은 결산 보고서에 있는 대로 4.6%이며 요약에 실수가 발생했다고 한다.

그 밖에도 빙은 결산 보고서를 요약해 갭이 다음 분기 두 자릿수 전반 순매출 성장을 예측하고 있다고 출력했지만 갭은 결산 보고서 중 2022년 4분기 순매출은 전년 동기 대비 한 자릿수 중반 감소를 기록할 가능성이 있다고 기록하고 있어 완전히 잘못된 요약을 한 걸 알 수 있다.

더구나 데모 초반에 애완동물 청소기 히트 상품 TOP3 장단점에 대해 빙이 고른 애완동물 진공 청소기 중 하나(Bissell Pet Hair Eraser Handheld Vacuum)에 대한 설명이 잘못됐다. 구체적으로 빙은 이 청소기 단점으로 코드 길이가 4.9m로 짧다고 밝혔지만 이 진공 청소기는 휴대가 편리한 무선 모델이다. 더구나 판매 TOP3을 알려달라고 했지만 빙은 가장 추천하고 싶은 모델을 골랐을 뿐 히트 상품 모델은 아니었다고 한다.

그 밖에 멕시코시티 나이트 라이프 소개에선 에러를 일으키는 해프닝도 발생하고 있다. 데모에서 빙은 한 식당(Ceconi’s Bar)에 대해 에약이나 메뉴를 확인할 수 있는 웹사이트가 있다고 출력했지만 실제로는 검색엔진 상에서 이곳을 검색해도 해당 웹사이트를 찾을 수 없다고 한다.

또 마이크로소프트는 데모에서 빙이 1990년대 음악 관련 퀴즈를 만들 능력이 있다고 어필했다. 실제로 데모에서 빙은 선택식 퀴즈를 10개 작성했는데 모두 정답이 A였다고 한다. 마이크로소프트가 작성한 빙에 자주 묻는 질문에는 빙은 모든 답변이 신뢰할 수 있는 소스를 기반으로 하는 걸 목적으로 하고 있지만 AI는 실수를 일으킬 수 있고 인터넷상 타사 콘텐츠가 항상 정확하거나 신뢰할 수 있는 건 아니라며 직접 판단하고 빙 답변에 따라 의사 결정을 내리거나 조치를 취하기 전에 사실을 확인하라고 밝히고 있다. 잘못된 출력을 할 가능성에 대해 주의를 환기한 것이다. 덧붙여 빙과 비슷한 시기 발표된 구글 바드(Bard) 역시 발표 당시 부정확한 대답으로 화제를 모았다.

채팅 AI를 통합한 검색 툴인 바드나 빙에 대해선 그 밖에도 회의적인 목소리가 나오고 있다. 한 전문가는 AI를 이용한 검색이 어느 정도 작동할지 불투명하다며 언어 모델이 실패하거나 잘못된 정보를 전파하면 큰 영향을 줄 수 있다고 지적했다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

모든 기사 보기