Googleが近日中にGemini 3.1 Flash Liveモデルを正式に発表し、これまでで最高品質のオーディオおよび音声モデルと称しています。このモデルはGemini LiveとSearch Live機能のコア駆動力となり、現在Google AI StudioでGemini Live APIを通じてプレビュー提供されています。今回のアップグレードはGemini Liveサービスにとってこれまでで最も重要な更新と見なされています。
前世代モデルと比較して、Gemini 3.1 Flash Liveは複数の主要指標でブレークスルーを実現しています。新モデルはピッチや話す速度などの音声の詳細をより効果的に認識し、遅延を大幅に低減します。その環境ノイズフィルタリング能力が大幅に強化され、交通やテレビなどのバックグラウンドノイズからユーザーの音声をより正確に分離できます。モバイル版Gemini Liveアプリでは、ユーザー体験が実質的に改善されています:応答速度が向上し、気まずい間が減り、会話の連続性が2倍向上したため、ユーザーが長時間のブレインストーミング中に思考が途切れにくくなりました。さらに、システムは現在、会話の状況に応じて回答の長さと口調を動的に調整できます。


