Hôm nay, Google chính thức ra mắt Gemini 3.5 Live Translate, mô hình dịch thuật thời gian thực từ giọng nói sang giọng nói thế hệ mới nhất. Khác với dịch thuật kiểu "đối thoại luân phiên" truyền thống, 3.5 Live Translate có khả năng tạo giọng nói liên tục, cân bằng giữa việc chờ ngữ cảnh để nâng cao chất lượng và dịch tức thời để duy trì đồng bộ. Mô hình này hiện đã được triển khai trên ứng dụng Google Dịch dành cho Android và iOS, hỗ trợ dịch giọng nói tự nhiên, trôi chảy với hơn 70 ngôn ngữ.
Đối với người dùng Android, Google Dịch cũng đồng thời ra mắt một tính năng hoàn toàn mới là "Chế độ nghe", cho phép người dùng nghe trực tiếp kết quả dịch qua loa điện thoại mà không cần tai nghe. Ngoài ra, Gemini 3.5 Live Translate cũng đang được tích hợp vào Google Meet, mang lại khả năng giao tiếp đa ngôn ngữ theo thời gian thực trong các cuộc họp video. Về phía nhà phát triển, mô hình này đã được cung cấp dưới dạng bản xem trước công khai thông qua Gemini Live API và Google AI Studio, cho phép tích hợp khả năng này vào các ứng dụng bên thứ ba.

