테크레시피

구글, AI 파일 형식 식별 도구 오픈소스로 공개

구글 연구팀이 AI를 활용해 파일 형식을 빠르고 효율적으로 식별하는 도구인 마지카(Magika)를 개발해 오픈소스로 공개했다. 마지카는 99% 이상 정밀도로 바이너리나 텍스트 파일 혀익을 검출해 CPU 상에서도 밀리초 이내에 실행할 수 있다고 한다.

현대 사회는 인터넷이나 컴퓨터 없니 성립되지 않으며 악의적 공격자로부터 사용자를 보호하는 사이버 보안 중요성이 한때 증가하고 있다. 하지만 사이버 보안 과제 중 하나는 공격자가 단 하나 취약성을 찾아 공격하면 되지만 방어 측은 디지털 영역 전체에서 항상 최선의 방어책을 전개해야 한다는 점이다. 사이버 공간은 공격자에게 유리한 상황이 되고 있으며 방어 측은 대부분 이미 존재하는 위협을 경감할 수밖에 없다.

구글 측은 이런 방어 측 딜레마라는 상황을 AI 힘으로 역전시킬 수 있다고 말한다. AI는 위협 탐지, 악성코드 분석, 취약성 탐지와 수정, 사고 대응에 보안 전문가 작업을 확장해줄 수 있다는 것. 따라서 구글 연구팀은 새롭게 AI를 이용해 파일 형식을 빠르고 효율적으로 식별하는 마지카를 개발해 오픈소스로 공개했다.

악의적 공격자는 악성코드를 포함한 파일을 정상 파일로 위장해 이메일에 첨부해 보내거나 다운로드하도록 한다. 위험한 파일을 통한 공격을 막는 첫 단계로 파일 형식을 정확하게 식별해야 한다. 지금까지 컴퓨터가 파일 형식을 식별하는 많은 소프트웨어는 사람 손에 의한 사용자 정의 규칙에 의존해왔다. 하지만 수동 접근법은 시간이 걸리는데 오류가 발생하기 쉽고 악의적 공격자 대책에 대해 그리 신뢰성이 높지 않다.

반면 마지카는 고도로 최적화된 맞춤형 딥러닝 모델을 사용해 높은 정확도로 파일 형식을 식별할 수 있다. 또 모델 크기가 1MB여서 CPU에서도 밀리초 단위로 파일을 식별할 수 있다는 설명이다.

마지카에서 식별할 수 있는 파일 형식과 정밀도는 공식 페이지를 통해 확인할 수 있다. 연구팀에 따르면 마지카는 대부분 파일 형식에서 99% 이상 정확도를 자랑한다고 한다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독