구글, '제미니 3.1 플래시 라이브' 출시로 음성 경험 혁신

구글이 Gemini 3.1 Flash Live를 공개하며, 이를 현재 "최고 품질의 오디오 및 음성 모델"로 소개했습니다. 이 모델은 Gemini Live와 Search Live의 주요 업그레이드를 이끌 예정입니다. 이 모델은 Google AI Studio의 Gemini Live API를 통해 미리 보기 버전으로 제공되며, 이전 2.5 Flash Native Audio 대비 더 낮은 지연 시간을 가지고 음높이, 말속도 등 음향 세부 사항을 더욱 정교하게 인식합니다.

실제 대화 경험에서 Gemini 3.1 Flash Live는 교통 소음, TV 소리 같은 배경음에서 유효한 사람 목소리를 더 잘 구별하고 추출하며, 배경 소음을 더 효과적으로 필터링합니다. 구글에 따르면, Gemini Live는 Android와 iOS에서 더 빠른 응답 속도와 어색한 멈춤 현상 감소를 제공할 것이며, 대화 문맥을 기존의 두 배 더 오래 유지하여 장시간 브레인스토밍과 연속 질문을 지원합니다. 또한 시스템은 소통 상황에 맞춰 답변 길이와 어조를 동적으로 조정합니다.

동시에, 구글은 이 모델을 활용하여 Search Live 서비스를 전 세계 200개 이상의 국가 및 지역으로 확장하고 있으며, 현재 AI 모드가 사용 가능한 언어와 위치를 모두 포함합니다. 전망해 보면, 더 낮은 지연 시간과 향상된 방음 능력은 음성 상호작용이 '가용(可用)'에서 '유용(好用)'으로 나아가는 중요한 분수령이 될 것입니다.

기사 검색

인기 기사

ChatGPT를 가장 잘 활용할 수 있는 몇 가지 프롬프트(Prompt) — 효율을 진짜 10배 올리는 사용법

Claude Code 설치가 계속 오류 나나요? 3단계로 설정 문제를 끝내는 단계별 가이드

ChatGPT Claude Gemini Midjourney 출력이 망했을 때의 트러블슈팅 체크리스트와 프롬프트 KISS 팁

ChatGPT, Claude, Gemini와 Midjourney를 효율적으로 연동하는 워크플로: 출력 불일치와 개고 고충 해결

ChatGPT와 Claude 답변 불일치 문제 해결: AI를 정확히 이해시키는 3가지 질문 기술