테크레시피

오픈소스 대규모 언어 처리 모델 문 열었다

이미지 생성 AI인 스테이블 디퓨전(Stable Diffusion) 학습용 데이터세트인 LAION-5B를 개발한 라이언-AI(LAION-AI)가 누구나 액세스할 수 있는 오픈소스 대규모 언어 처리 모델인 오픈 어시스턴트(Open Assistant) 데이터 수집용 프런트 엔드를 공개했다.

챗GPT 같은 대화형 AI를 학습시키려면 엄청난 텍스트로 이뤄진 데이터세트가 필요하다. 따라서 라이언-AI는 오픈소스 대화형 AI를 개발하는 프로젝트를 시작할 때 인간이 생성한 고품질 샘플로 AI에 대한 입력 텍스트와 이에 대한 응답을 수집하는 프런트 엔드를 시작한 것.

이 프런트 엔드는 이메일 주소를 등록해 사용할 수 있으며 로컬로 개발 환경을 실행해 액세스할 수도 있다. 또 로컬에서 개발 환경을 실행해 액세스하는 경우 도커를 설치한 PC에서 오픈 어시스턴트 리포지토리를 로컬로 복제하고 리포지토리 루트 디렉터리에서 빌드한다.

프런트 엔드에선 오른쪽 위 버튼(Sign In)을 누르고 이메일 주소나 디스코드 계정을 등록하는 것으로 액세스할 수 있다. 오픈 어시스턴트는 참가자 업적을 보여주는 시스템을 채택해 긍정적인 동기 부여를 향상시켜준다. 대시보드에는 더 많은 작업을 수행한 사람 순위 기록이 표시된다.

라이언-AI는 오픈 어시스턴트에 대해 챗GPT를 복제하는 것에 머물러 있지 않을 것이며 누구나 커스터마이징하고 확장할 수 있는 미래 어시스턴트를 만들기를 기대한다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독