Google ने हाल ही में आधिकारिक तौर पर Gemini 3.1 Flash Live की घोषणा की है और इसे अब तक का "उच्चतम गुणवत्ता वाला ऑडियो और वॉयस मॉडल" करार दिया है। यह मॉडल Gemini Live और Search Live को कोर अपग्रेड प्रदान करने के लिए तैयार है और अब Google AI Studio में Gemini Live API के माध्यम से पूर्वावलोकन के लिए उपलब्ध है।
इस अपग्रेड के साथ कई महत्वपूर्ण सुधार आए हैं: मॉडल स्वर, ताल जैसी ध्वनिक बारीकियों को पहले से अधिक प्रभावी ढंग से पहचान सकता है और इसने पिछले 2.5 Flash Native Audio मॉडल की तुलना में कम विलंबता (Latency) प्रदान की है। यह प्रासंगिक आवाज़ और परिवेशीय शोर (जैसे यातायात या टीवी की आवाज़) के बीच बेहतर भेदभाव करता है, खासकर पृष्ठभूमि के शोर को फ़िल्टर करने की क्षमता में मजबूती आई है। Android और iOS पर Gemini Live में, 3.1 Flash Live ने तेज़ प्रतिक्रिया समय हासिल किया है, जिससे बातचीत के दौरान होने वाले अजीब ठहराव कम हुए हैं। साथ ही, यह बातचीत के धागे को ट्रैक करने की अवधि को दोगुना कर देता है, जिससे लंबे ब्रेनस्टॉर्मिंग सत्रों में विचारों की निरंतरता बनी रहती है। इसके अतिरिक्त, Gemini Live अब रीयल-टाइम स्थिति के अनुरूप जवाब की लंबाई और स्वर को गतिशील रूप से समायोजित कर सकता है।

