Người dùng đăng ký ChatGPT Plus vừa đón nhận bản cập nhật lớn với mô hình GPT-4o chính thức ra mắt. So với phiên bản trước GPT-4 Turbo, GPT-4o mang đến bước nhảy vượt bậc về tương tác giọng nói, dịch thuật thời gian thực, chia sẻ màn hình – thực sự hiện thực hóa trải nghiệm AI đa phương thức toàn năng. Dưới đây là phân tích chi tiết từng tính năng mới hữu ích này.
Nâng cấp hội thoại tự nhiên và chế độ giọng nói
Chữ "o" trong GPT-4o đại diện cho "omni" (toàn năng), không chỉ giới hạn ở nhập liệu văn bản mà còn tích hợp khả năng suy luận từ âm thanh, video và chữ viết. Giờ đây bạn có thể trực tiếp trò chuyện bằng giọng nói với ChatGPT Plus, mô hình có thể cảm nhận được giọng điệu và cảm xúc thay đổi, phản hồi cũng tự nhiên và mượt mà hơn. Chế độ giọng nói nâng cấp có độ trễ thấp hơn, cuộc hội thoại liền mạch như đang nói chuyện với người thật, không còn cảm giác máy móc như trước.
Trong trải nghiệm thực tế, dù là tán gẫu hay thảo luận chủ đề nghiêm túc, GPT-4o đều có thể điều chỉnh phong cách phản hồi dựa trên tốc độ nói và cảm xúc của bạn. Kiểu tương tác giọng nói nhập vai này giúp giảm đáng kể rào cản sử dụng, đặc biệt phù hợp khi đang lái xe hoặc làm việc nhà.
Dịch thuật thời gian thực phá vỡ rào cản ngôn ngữ
Phiên bản ChatGPT cũ tuy cũng hỗ trợ dịch thuật, nhưng GPT-4o đã nâng khả năng này lên một tầm cao mới. Mô hình nắm vững hơn 50 ngôn ngữ và có thể chuyển đổi nhanh chóng giữa các ngôn ngữ khác nhau, thực hiện phiên dịch thời gian thực thực sự. Dù bạn cần nghe hiểu bài phát biểu nước ngoài trong cuộc họp công việc hay muốn giao tiếp không rào cản với người bản xứ khi đi du lịch nước ngoài, GPT-4o đều có thể hoàn thành nhận diện giọng nói và dịch thuật ngay tại chỗ.
Tôi đã thử nghiệm tình huống dịch Anh – Việt, tốc độ phản hồi gần như không có độ trễ, đồng thời giữ lại chi tiết về giọng điệu và ngữ cảnh. Với những người dùng ChatGPT Plus thường xuyên cần giao tiếp đa ngôn ngữ, tính năng này giúp tiết kiệm trực tiếp chi phí mua phần mềm dịch thuật.


