Google이 최근 Gemini 3.1 Flash Live를 공식 발표하며 '지금까지 최고 품질의 오디오 및 음성 모델'이라고 명명했습니다. 이 모델은 Gemini Live와 Search Live의 핵심 업그레이드를 제공하며, 현재 Google AI Studio의 Gemini Live API를 통해 미리 보기로 공개되었습니다.
이번 업그레이드에서는 여러 가지 두드러진 개선 사항이 도입되었습니다: 모델이 음조, 리듬 등의 음향 세부 사항을 더 효과적으로 인식하며, 이전 세대 2.5 Flash Native Audio 대비 더 낮은 지연 시간을 제공합니다. 또한 관련 음성과 교통 소음이나 TV 소리 같은 환경 소음을 구분하는 능력이 향상되어, 특히 배경 소음 필터링 기능이 강화되었습니다. Android와 iOS의 Gemini Live에서 3.1 Flash Live는 더 빠른 응답 속도를 구현하여 대화 중 어색한 멈춤을 줄이고, 대화 스레드 추적 시간을 두 배로 연장하여 장기적인 브레인스토밍 중 사고의 연속성을 유지하는 데 도움이 됩니다. 더불어 Gemini Live는 이제 실시간 상황에 맞춰 답변 길이와 어조를 동적으로 조정할 수 있습니다.


