Google은 Gemini 3.1 Flash Live를 공개하며, 이를 현재 “가장 높은 품질의 오디오 및 음성 모델”이라고 소개했다. 이 모델은 Gemini Live와 Search Live의 주요 업그레이드를 구동하기 위한 것으로, 현재 Google AI Studio에서 Gemini Live API를 통해 프리뷰로 제공된다. 2.5 Flash Native Audio 대비 지연 시간이 더 짧고, 음성의 피치(음높이)와 말하기 속도 등 미세한 음향 특성을 더 잘 인식한다.
복잡한 환경에서도 Gemini 3.1 Flash Live는 사용자의 발화와 교통 소음, TV 소리 등 주변음을 더 정확히 구분하며, Google은 배경 소음 필터링 성능이 더 강력하다고 강조했다. Android 및 iOS용 Gemini Live에서는 새 모델을 통해 더 빠른 응답과 어색한 멈춤이 줄어든 대화 경험을 제공하며, 대화 맥락을 연속적으로 따라갈 수 있는 시간을 기존 대비 2배로 늘려 더 긴 토론과 브레인스토밍을 지원한다. 또한 대화 상황에 맞춰 답변 길이와 말투를 동적으로 조정한다.

