
구글이 돌고래 대화 음성을 생성할 수 있는 AI인 돌핀젬마(DolphinGemma)를 개발했다. 돌핀젬마는 구글 제조 스마트폰인 픽셀 시리즈에서 작동하도록 설계됐으며 돌고래 커뮤니케이션 관련 연구에서 성과를 거둘 것으로 기대된다.
돌고래는 구애할 때 딸깍거리는 클릭 소리를 내거나 개체별로 고유한 시그니처 휘슬을 사용해 서로를 부르는 등 대화 행동을 한다고 알려져 있다.
돌고래에 관한 연구 프로젝트인 WDP(Wild Dolphin Project)는 대서양 점박이 돌고래 특정 집단을 1985년부터 지속적으로 관찰해 왔으며 돌고래 각 개체 상세 정보와 연결된 음성 데이터를 대량 축적하고 있다. 구글은 자사가 개발한 기반 모델 젬마(Gemma)와 WDP가 축적해온 데이터를 결합해 돌고래 울음소리를 생성할 수 있는 AI 모델인 돌핀젬마를 개발했다. 돌핀젬마 파라미터 수는 4억 개로 픽셀 시리즈에서 작동하도록 설계됐다.

돌핀젬마는 WDP가 개발하는 수중 기기 CHAT(Cetacean Hearing and Telemetry)에서 활용된다. CHAT은 알려진 돌고래 언어를 인간용으로 번역하는 기능과 돌고래용으로 설계한 음성을 수중에서 발하는 기능 등을 갖추고 있으며 돌고래와 인간 양방향 커뮤니케이션을 가능하게 하는 걸 목표로 개선이 계속되고 있다.
CHAT 사용 예는 먼저 돌고래 장난감 격인 스카프를 가진 상태로 인간 2명이 돌고래에게 접근한다. 돌고래가 인간을 보고 있는 상태에서 한쪽 인간이 CHAT에서 음성을 발하고 다른 쪽 인간으로부터 스카프를 받는다. 이 모습을 목격한 돌고래는 저 소리를 내면 스카프를 받을 수 있다고 학습하는 것이다.
현재 CHAT 컴퓨터에 픽셀 6이 사용되고 있다고 한다. 이미 픽셀 9를 탑재한 CHAT 개발이 진행 중이며 올 여름에는 픽셀 9와 돌핀젬마를 이용한 연구가 시작될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.