Google, Gemini 3.1 Flash Live 공개… Gemini Live 음성 경험 대폭 업그레이드

Google은 Gemini 3.1 Flash Live를 공개하며, 이를 현재 “가장 높은 품질의 오디오 및 음성 모델”이라고 소개했다. 이 모델은 Gemini Live와 Search Live의 주요 업그레이드를 구동하기 위한 것으로, 현재 Google AI Studio에서 Gemini Live API를 통해 프리뷰로 제공된다. 2.5 Flash Native Audio 대비 지연 시간이 더 짧고, 음성의 피치(음높이)와 말하기 속도 등 미세한 음향 특성을 더 잘 인식한다.

복잡한 환경에서도 Gemini 3.1 Flash Live는 사용자의 발화와 교통 소음, TV 소리 등 주변음을 더 정확히 구분하며, Google은 배경 소음 필터링 성능이 더 강력하다고 강조했다. Android 및 iOS용 Gemini Live에서는 새 모델을 통해 더 빠른 응답과 어색한 멈춤이 줄어든 대화 경험을 제공하며, 대화 맥락을 연속적으로 따라갈 수 있는 시간을 기존 대비 2배로 늘려 더 긴 토론과 브레인스토밍을 지원한다. 또한 대화 상황에 맞춰 답변 길이와 말투를 동적으로 조정한다.

아울러 Google은 Gemini 3.1 Flash Live를 바탕으로 Search Live를 전 세계로 확대하고 있으며, 200개 이상 국가에서 출시해 현재 AI Mode가 제공되는 모든 언어와 지역을 포괄한다. 저지연 음성 모델이 API 프리뷰 단계에 들어서면서, 실시간 음성 상호작용의 안정성과 활용성은 한층 더 높아질 것으로 기대되며, 더 많은 애플리케이션 적용도 가속화될 전망이다.

기사 검색

인기 기사

ChatGPT를 가장 잘 활용할 수 있는 몇 가지 프롬프트(Prompt) — 효율을 진짜 10배 올리는 사용법

Claude Code 설치가 계속 오류 나나요? 3단계로 설정 문제를 끝내는 단계별 가이드

ChatGPT Claude Gemini Midjourney 출력이 망했을 때의 트러블슈팅 체크리스트와 프롬프트 KISS 팁

ChatGPT, Claude, Gemini와 Midjourney를 효율적으로 연동하는 워크플로: 출력 불일치와 개고 고충 해결

ChatGPT와 Claude 답변 불일치 문제 해결: AI를 정확히 이해시키는 3가지 질문 기술