테크레시피

[위클리 팟캐스트] 구글 영상 AI‧오픈AI GPT-4o 나왔다

이번 주에 시선을 모은 건 역시 생성형 AI 차세대 모델입니다. 구글과 오픈AI가 일제히 새로운 모델을 발표했는데요.

먼저 구글은 5월 14일 구글 I/O 행사를 열고 주요 제품과 서비스를 발표했습니다. 이 날 발표한 주요 사항은 영상과 음성을 이해하고 실시간으로 질문에 답변해주는 AI 에이전트인 프로젝트 아스트라, 고해상도 동영상을 생성하는 AI 모델인 베오, AI 음악 제작 도구인 뮤직 AI 샌드박스, 제미나이 개인화 기능인 젬스, 비주얼 언어 모델과 오픈소스 대규모 언어 모델인 팔리젬마와 젬마 2, 교육 연구용 AI 모델인 런LM 등을 일제히 발표했습니다.

오픈AI도 5월 14일 AI 모델인 GPT-4o를 발표했습니다. GPT-4o는 텍스트, 음성, 시각 입력을 고속 처리할 수 있는 멀티모달 AI 모델인데요. 텍스트와 음성, 시각 입력을 높은 속도로 처리할 수 있으며 실시간으로 대화하면서 계산 문제 풀기나 이미지 생성, 주변 영상에서 상황 판단 등 작업 수행이 가능합니다. 응답 시간은 평균 320밀리초이며 음성 입력에는 232밀리초로 인간과 동등한 속도라고 합니다.

그런가 하면 ARM이 2025년 후반 양산 개시를 목표로 AI 칩 개발 부문 설립을 계획하고 있다는 보도가 나오기도 했습니다. 모기업인 소프트뱅크 핵심 펀드인 소프트뱅크 비전 펀드는 과거 주류였던 벤처캐피털 사업에서 반도체와 AI로 전략적 투자를 전환한다는 지적인데요. 그 일환으로 소프트뱅크가 지분 90%를 보유한 ARM에 AI 칩 부문을 설립해 2025년 봄까지 프로토타입을 구축하고 2025년 가을 이후 양산 개시를 목표로 하고 있다는 것입니다.

넷플릭스 광고 포함 플랜 월간 활성 사용자 수가 5월 15일 기준으로 4,000만 명 도달했다고 합니다. 넷플릭스에 따르면 광고 포함 플랜 월간 활성 사용자 수가 1년 사이 500만 명에서 4,000만 명으로 증가했는데요. 광고 포함 플랜을 제공하는 국가에서만 보면 전체 가입자 40%가 광고 포함 플랜 선택했고 광고 포함 플랜 가입자 70% 이상이 매달 10시간 이상 콘텐츠를 시청하고 있다고 하는데요. 이는 넷플릭스와 가장 유사한 경쟁사보다 15%p 높은 수준이라고 합니다.

틱톡이 재생시간 60분이라는 비교적 긴 동영상을 업로드할 수 있는 기능 테스트 중이라고 합니다. 틱톡은 원래 15초 동영상을 업로드하고 공유하는 서비스로 출발했지만 현재 사용자는 최장 10분 동영상, 일부 크리에이터는 지난 1월부터 최대 30분 동영상 업로드가 가능합니다. 또 구독 플랜으로 콘텐츠를 판매하는 사용자는 최대 20분 동영상을 올릴 수도 있는데요. 다만 틱톡 측은 이번에 보도된 60분 업로드 기능을 곧바로 광범위하게 이용할 수 있게 할 계획은 없는 상태라고 합니다. 감사합니다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독