구글이 Gemini 3.1 Flash Live를 공개하며, 이를 현재 "최고 품질의 오디오 및 음성 모델"로 소개했습니다. 이 모델은 Gemini Live와 Search Live의 주요 업그레이드를 이끌 예정입니다. 이 모델은 Google AI Studio의 Gemini Live API를 통해 미리 보기 버전으로 제공되며, 이전 2.5 Flash Native Audio 대비 더 낮은 지연 시간을 가지고 음높이, 말속도 등 음향 세부 사항을 더욱 정교하게 인식합니다.
실제 대화 경험에서 Gemini 3.1 Flash Live는 교통 소음, TV 소리 같은 배경음에서 유효한 사람 목소리를 더 잘 구별하고 추출하며, 배경 소음을 더 효과적으로 필터링합니다. 구글에 따르면, Gemini Live는 Android와 iOS에서 더 빠른 응답 속도와 어색한 멈춤 현상 감소를 제공할 것이며, 대화 문맥을 기존의 두 배 더 오래 유지하여 장시간 브레인스토밍과 연속 질문을 지원합니다. 또한 시스템은 소통 상황에 맞춰 답변 길이와 어조를 동적으로 조정합니다.


