테크레시피

실시간으로 기밀 정보 숨기면서 음성→텍스트 변환 AI 모델

최근에는 위스퍼(Whisper) 등 음성-텍스트 변환 AI가 다수 등장하고 있다. 하지만 이런 음성-텍스트 변환 AI에 대해 일부 기업은 기밀 정보가 유출될 수 있다는 위험을 우려하며 경계심을 강화하고 있다. 이런 상황에서 이스라엘 AI 스타트업 aiOla가 개발한 음성-텍스트 변환 AI 위스퍼너(WhisperNER)는 기밀 정보를 자동으로 식별해 숨길 수 있다.

aiOla에 따르면 위스퍼너는 오픈AI 오픈소스 AI 모델인 위스퍼(Whisper)를 기반으로 구축된 음성-텍스트 변환 AI로 프라이버시 보호와 데이터 보호 규정 준수에 중점을 두고 있다고 한다. 위스퍼너는 오디오 파일을 처리하는 동시에 개체명 인식(NER)을 적용해 출력된 텍스트 내 이름, 전화번호, 주소 등 기밀 정보에 태그를 붙이거나 마스킹할 수 있다.

또 자동 음성 인식(AER) 도구와 NER 도구를 별도로 사용할 필요가 없는 위스퍼너는 데이터 침해에 대한 취약성이 감소된 것도 특징 중 하나다. aiOla 연구 담당 부사장인 길 헤츠는 자사는 위스퍼너를 AI 프라이버시를 향상시키기 위한 오픈소스 도구로 설계했다며 이를 통해 사용자는 추가 소프트웨어 없이도 기밀 데이터를 마스킹할 수 있다고 말했다. 위스퍼너 데모는 허깅페이스에 공개되어 있으며 누구나 사용할 수 있습니다.

한편 aiOla에 따르면 위스퍼너는 영어 데이터로만 학습되고 평가됐다고 한다. 위스퍼너소스 코드는 깃허브 페이지에서 다운로드할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사