Google、新音声AIモデル「Gemini 3.1 Flash Live」で会話体験を大幅進化

GoogleはGemini 3.1 Flash Liveを発表し、現在「最高品質のオーディオおよび音声モデル」と称し、Gemini LiveとSearch Liveの大幅なアップグレードを推進します。このモデルはGoogle AI StudioのGemini Live APIを通じてプレビュー版が提供され、2.5 Flash Native Audioに比べて低遅延であり、音高や話速などの音響詳細の認識に優れています。

実際の会話体験では、Gemini 3.1 Flash Liveは交通やテレビなどの環境音から有効な人声を区分して抽出し、背景ノイズをより効果的にフィルタリングできます。Googleによると、Gemini LiveはAndroidとiOSでより速い応答、不自然な間の減少が得られ、同時に会話のコンテキスト保持時間を2倍に向上させ、長時間のブレインストーミングと連続した質問をサポートします。システムはまた、交流シーンに合わせて回答の長さとトーンを動的に調整します。

同時に、Googleはこのモデルを活用してSearch Liveを世界200以上の国と地域に展開し、現在AIモードが利用可能な言語と位置をカバーします。展望として、低遅延と強力なノイズ耐性は、音声インタラクションが「利用可能」から「使いやすい」へと進化する重要な分水嶺となるでしょう。

記事を検索

人気記事

ChatGPTの「使える」プロンプト（Prompt）厳選。効率を本当に10倍に上げる使い方

Claude Codeのインストールでいつもエラー？手取り足取り、たった3ステップで設定の悩みを解決

ChatGPT・Claude・Gemini・Midjourneyの出力が盛大にコケたときの切り分けチェックリストと、プロンプトKISSのコツ

ChatGPT・Claude・Gemini・Midjourneyを連動！出力のばらつきと改稿ストレスを解消する効率的ワークフロー

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求