테크레시피

IBM, 자사 코드 생성 AI 오픈소스화했다

IBM은 자사 AI인 그래니트(Granite) 코드 생성 모델 제품군을 오픈소스화했으며 116개 프로그래밍 언어로 학습됐고 파라미터 수는 30억~340억개다.

소프트웨어는 현대 사회 모든 측면에 도입되어 생산성 향상과 과학기술 발전에 기여해왔다. 하지만 신뢰성 높은 소프트웨어를 제작, 디버깅, 배포하는 작업은 골치 아픈 일이며 숙련된 개발자라도 최신 기술이나 언어를 따라가기 어렵다. 이에 미국 IT기업 IBM은 프로그래밍 코드 생성, 수정, 다른 언어로 번역 같은 작업을 수행하는 그래니트 코드 생성 모델 제품군을 오픈소스로 공개했다.

IBM은 이전부터 AI 기술로 코드 개발 및 배포 속도를 높이는 작업에 착수해왔으며 이미 코볼을 자바로 변환하는 AI인 왓슨 코드 어시스턴트(watsonx Code Assistant)를 개발한 바 있다. IBM은 대규모 언어 모델 기반 에이전트는 복잡한 작업을 자율 처리할 것으로 기대되며 코드 생성 대규모 언어 모델에 대한 가능성을 최대한 실현하려면 코드 생성, 버그 수정, 코드 설명 및 문서화, 리포지토리 관리 등 다양한 기능이 필요하다고 설명했다.

이어 5월 7일 IBM은 자사 AI 모델인 그래니트 코드 생성 모델 제품군을 오픈소스로 공개했다. 그래니트 코드 생성 모델은 116개 프로그래밍 언어로 학습됐으며 코드 생성, 설명, 수정, 편집, 번역 등 다양한 작업을 수행할 수 있다고 한다.

그래니트 코드 생성 모델에는 파라미터 크기별로 3B, 8B, 20B, 34B 등 4가지 유형이 있으며 각각 기본 코드 생성 작업을 수행하는 베이스 모델(Base Models)과 코드 명령 데이터세트로 미세조정 등을 거친 인스트럭트 모델(Instruct Models) 등 2가지 변종이 있다. IBM은 이들 모델이 복잡한 애플리케이션 현대화 작업에서부터 디바이스 메모리 제약이 있는 사용례에 이르기까지 다양한 용도가 있다고 설명했다.

6개 프로그래밍 언어를 사용한 3가지 코딩 작업 성능 평가에서 그래니트 코드 생성 모델은 다른 모델과 유사하거나 뛰어난 성능을 보였다. IBM은 포괄적인 작업 세트로 평가한 결과 이들 그래니트 코드 생성 모델이 현재 사용 가능한 오픈소스 코드 생성 모델 중 최첨단 수준 성능을 발휘하는 것으로 나타났다며 이 다목적 모델군은 기업 소프트웨어 개발 워크플로에 최적화되어 코드 생성, 수정, 설명 등 다양한 코딩 작업에서 뛰어난 성능을 발휘한다고 밝혔다.

아울러 이번 발표와 함께 IBM 자회사이자 클라우드 서비스 기업 레드햇은 그래니트 생성 AI 모델을 원활히 개발, 테스트, 실행할 수 있는 기반 모델 플랫폼인 레드햇 엔터프라이즈 리눅스 AI(RHEL AI) 개발자 프리뷰 버전을 공개했다. 새로운 AI 개발 플랫폼(InstructLab)과 RHEL AI를 결합하면 개발자가 생성형 AI가 직면하는 많은 장벽을 극복하는 데 도움이 될 것이라고 한다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독