텍스트 생성 AI 클로드 “GPT-4 3배 가까운 토큰 대응”

챗GPT와 같은 대화형 AI는 고정밀 텍스트를 생성할 수 있지만 입력이 가능한 언어 최소 단위인 토큰에는 한계가 있다. 오픈AI GPT-4는 3만 2,000토큰까지의 입력이 가능하지만 AI 스타트업인 앤트로픽(Anthropic)이 텍스트 생성 AI인 클로드(Claude) 토큰을 9,000에서 10만으로 확장한다고 발표했다.

전통적인 AI 모델은 수천 토큰을 입력하면 사람이 처음으로 지시하는 걸 잊고 문장 최신 정보에서 행동을 결정하는 문제가 있다. 오픈AI 같은 AI 개발사는 이런 문제에 대처하기 위해 개발, 연구를 실시하고 있지만 오픈AI에 의한 대규모 언어 모델인 GPT-4에서도 3만 2,000 토큰이 상한으로 책이나 연구 논문 요약이나 대규모 코딩 등은 아직 어려운 것으로 알려져 있다.

만일 입력 가능한 토큰 수가 증가하면 책이나 논문 등 자료 요약이 가능하게 될 뿐 아니라 지금까지 어려웠던 몇 시간이나 며칠간에 걸친 AI와의 건설적 대화가 가능하게 된다.

앤트로픽은 자사가 개발하는 텍스트 생성 AI 모델인 클로드 최대 토큰 수를 지금까지의 9,000토큰에서 10만 토큰으로 확장해 7만 5,000자 영어 문장에 대응한다고 발표했다. 앤트로픽은 클로드 대응 가능 토큰 수 증가에 의해 장문 대응이 가능하게 됐다는 걸 밝히고 새로운 클로드에선 수백 페이지에 걸친 자료를 입력해 분석하는 기능이나 복수 문서나 책 등으로부터 정보를 지식 통합에 필요한 질문에 대답할 수 있다고 설명한다.

앤트로픽은 또 장문 대응 클로드에 대한 다양한 사용례를 소개하고 있다. 재무보고나 연구 논문 등 자료 이해, 요약, 설명은 물론 연간 보고서를 기반으로 한 기업 전략적 위험과 기회 분석, 법률 장단점 평가, 수백 페이지 개발자용 문서를 읽어 기술적 질문에 적절하게 대답하는 것 등을 들 수 있다.

앤트로픽은 사람은 평균 5시간당 10마 토큰 문장을 읽을 수 있지만 이 정보를 이해, 기억, 분석하려면 상당한 시간이 필요하다며 클로드는 1분 안에 이를 처리할 수 있다고 밝히고 있다. 실제로 소설 위대한 게츠비 전체를 읽게 하고 한 문장만 다르게 쓴 다음 원래 문장과 다른 게 뭔지 되묻자 22초 만에 정답이 되돌아왔다고 한다.

앤트로픽은 클로드는 인간이 불법 또는 비윤리적 활동, 차별적 출력을 일련의 원칙을 이용해 출력할 수 있는 판단하는 시스템을 탑재하고 있다고 밝혔다. 전통적인 대화형 AI는 학습에서 인간 피드백이 필요하지만 클로드는 세계인권선언과 애플 개인 정보 보호 정책, 딥마인드 대화형 AI를 위한 원칙 등 일련의 원칙에 따라 클로드 자체 답변을 비평하고 수정한다. 그 결과 클로드에선 기존 대화형 AI와 비교해 유해, 인종차별적, 성차별적 또는 불법, 폭력적, 비윤리적 행동을 장려하거나 지원하는 답변을 생성하기 어렵다고 한다.

클로드는 현재 프리뷰 단계이며 클로드를 이용하려면 앤트로픽에 요청을 해야 한다. 관련 내용은 이곳에서 확인할 수 있다.

Introducing 100K Context Windows! We’ve expanded Claude’s context window to 100,000 tokens of text, corresponding to around 75K words. Submit hundreds of pages of materials for Claude to digest and analyze. Conversations with Claude can go on for hours or days. pic.twitter.com/4WLEp7ou7U
— Anthropic (@AnthropicAI) May 11, 2023