Google ra mắt Gemini 3.5 Live Translate, hỗ trợ Google Meet và Google Translate

Hôm nay, Google chính thức ra mắt Gemini 3.5 Live Translate, mô hình dịch thuật thời gian thực từ giọng nói sang giọng nói thế hệ mới nhất. Khác với dịch thuật kiểu "đối thoại luân phiên" truyền thống, 3.5 Live Translate có khả năng tạo giọng nói liên tục, cân bằng giữa việc chờ ngữ cảnh để nâng cao chất lượng và dịch tức thời để duy trì đồng bộ. Mô hình này hiện đã được triển khai trên ứng dụng Google Dịch dành cho Android và iOS, hỗ trợ dịch giọng nói tự nhiên, trôi chảy với hơn 70 ngôn ngữ.

Đối với người dùng Android, Google Dịch cũng đồng thời ra mắt một tính năng hoàn toàn mới là "Chế độ nghe", cho phép người dùng nghe trực tiếp kết quả dịch qua loa điện thoại mà không cần tai nghe. Ngoài ra, Gemini 3.5 Live Translate cũng đang được tích hợp vào Google Meet, mang lại khả năng giao tiếp đa ngôn ngữ theo thời gian thực trong các cuộc họp video. Về phía nhà phát triển, mô hình này đã được cung cấp dưới dạng bản xem trước công khai thông qua Gemini Live API và Google AI Studio, cho phép tích hợp khả năng này vào các ứng dụng bên thứ ba.

Bản nâng cấp này đánh dấu một bước tiến quan trọng của Google trong lĩnh vực dịch thuật thời gian thực – chuyển từ phản hồi ngắt quãng sang luồng giọng nói mượt mà, độ trễ thấp, hứa hẹn cải thiện đáng kể trải nghiệm giao tiếp và cộng tác xuyên quốc gia. Với việc mở rộng hệ sinh thái dành cho nhà phát triển, trong tương lai có thể sẽ xuất hiện nhiều ứng dụng mới dựa trên mô hình này.

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần