Google Gemini 3.1 Flash Live 공개: 음성 모델의 획기적 업그레이드

Google이 최근 Gemini 3.1 Flash Live를 공식 발표하며 '지금까지 최고 품질의 오디오 및 음성 모델'이라고 명명했습니다. 이 모델은 Gemini Live와 Search Live의 핵심 업그레이드를 제공하며, 현재 Google AI Studio의 Gemini Live API를 통해 미리 보기로 공개되었습니다.

이번 업그레이드에서는 여러 가지 두드러진 개선 사항이 도입되었습니다: 모델이 음조, 리듬 등의 음향 세부 사항을 더 효과적으로 인식하며, 이전 세대 2.5 Flash Native Audio 대비 더 낮은 지연 시간을 제공합니다. 또한 관련 음성과 교통 소음이나 TV 소리 같은 환경 소음을 구분하는 능력이 향상되어, 특히 배경 소음 필터링 기능이 강화되었습니다. Android와 iOS의 Gemini Live에서 3.1 Flash Live는 더 빠른 응답 속도를 구현하여 대화 중 어색한 멈춤을 줄이고, 대화 스레드 추적 시간을 두 배로 연장하여 장기적인 브레인스토밍 중 사고의 연속성을 유지하는 데 도움이 됩니다. 더불어 Gemini Live는 이제 실시간 상황에 맞춰 답변 길이와 어조를 동적으로 조정할 수 있습니다.

Google은 이 모델을 기반으로 전 세계 200개 이상 국가 또는 AI Mode가 사용 가능한 모든 언어 및 지역에서 Search Live 기능을 전면 출시했습니다. 이 조치는 Google 음성 상호작용 기술의 보급과 최적화가 한 단계 발전했음을 의미합니다.

이번 업그레이드는 음성 AI의 실시간성과 정확성을 높일 뿐만 아니라, 더 자연스럽고 유창한 인간-기계 대화 경험의 토대를 마련하여, 일상에서 스마트 어시스턴트의 잠재력이 더욱 확대될 것을 예고하고 있습니다.

기사 검색

인기 기사

ChatGPT를 가장 잘 활용할 수 있는 몇 가지 프롬프트(Prompt) — 효율을 진짜 10배 올리는 사용법

Claude Code 설치가 계속 오류 나나요? 3단계로 설정 문제를 끝내는 단계별 가이드

ChatGPT Claude Gemini Midjourney 출력이 망했을 때의 트러블슈팅 체크리스트와 프롬프트 KISS 팁

ChatGPT, Claude, Gemini와 Midjourney를 효율적으로 연동하는 워크플로: 출력 불일치와 개고 고충 해결

Spotify 오류 코드 총정리 및 해결 가이드