GoogleはGemini 3.1 Flash Liveを発表し、現在「最高品質のオーディオおよび音声モデル」と称し、Gemini LiveとSearch Liveの大幅なアップグレードを推進します。このモデルはGoogle AI StudioのGemini Live APIを通じてプレビュー版が提供され、2.5 Flash Native Audioに比べて低遅延であり、音高や話速などの音響詳細の認識に優れています。
実際の会話体験では、Gemini 3.1 Flash Liveは交通やテレビなどの環境音から有効な人声を区分して抽出し、背景ノイズをより効果的にフィルタリングできます。Googleによると、Gemini LiveはAndroidとiOSでより速い応答、不自然な間の減少が得られ、同時に会話のコンテキスト保持時間を2倍に向上させ、長時間のブレインストーミングと連続した質問をサポートします。システムはまた、交流シーンに合わせて回答の長さとトーンを動的に調整します。


