Google lance Gemini 3.1 Flash Live : la plus grande mise à niveau jamais vue pour Gemini Live

Google a officiellement annoncé aujourd'hui le lancement du modèle vocal Gemini 3.1 Flash Live, présenté comme "son modèle audio et vocal de la plus haute qualité à ce jour", apportant des améliorations significatives aux services Gemini Live et Search Live. Ce modèle est actuellement disponible en aperçu dans Google AI Studio via l'API Gemini Live, ce qui représente une avancée importante pour Google dans les technologies d'interaction vocale en temps réel.

Comparé à la génération précédente 2.5 Flash Native Audio, Gemini 3.1 Flash Live identifie plus efficacement les détails acoustiques comme la hauteur et le rythme, tout en réduisant la latence. Il améliore notablement la filtration du bruit ambiant, distinguant mieux la parole des sons de fond tels que la circulation ou la télévision. Dans les applications Gemini Live sur Android et iOS, les utilisateurs obtiendront des réponses plus rapides, "réduisant les pauses gênantes", et la durée des fils de conversation est doublée, assurant une continuité de pensée lors de longs brainstormings. De plus, Gemini Live peut désormais ajuster dynamiquement la longueur et le ton des réponses pour s'adapter au contexte.

Google utilise également ce modèle pour déployer le service Search Live dans plus de 200 pays à travers le monde, couvrant toutes les langues et régions où le mode IA est disponible, favorisant un déploiement mondial de la recherche vocale en temps réel. Cette mise à niveau optimise non seulement l'expérience utilisateur, mais démontre aussi le potentiel d'intégration profonde de l'IA vocale dans des scénarios pratiques.

Le lancement de Gemini 3.1 Flash Live illustre les progrès continus de Google en matière de performances des modèles vocaux et d'interaction en temps réel. À l'avenir, cela pourrait encourager l'évolution des assistants intelligents vers plus de naturel et d'efficacité, et accélérer l'adoption mondiale des technologies vocales.

Rechercher des articles

Articles Populaires

Les meilleurs prompts (instructions) pour ChatGPT : des usages qui peuvent vraiment multiplier l’efficacité par 10

L’installation de Claude Code échoue toujours ? Tutoriel pas à pas : 3 étapes pour régler les problèmes de configuration

Checklist de dépannage et astuces KISS pour éviter les ratés dans les sorties de ChatGPT, Claude, Gemini et Midjourney

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

Guide complet des codes d'erreur Spotify et solutions