Bản cập nhật ChatGPT lần này có trọng tâm rõ ràng: chuyển từ “chỉ có thể chat bằng văn bản” thành một bàn làm việc có thể xem, nghe, nói và xử lý trực tiếp các tệp. Xoay quanh khả năng đa phương thức của GPT-4o, ChatGPT đã được nâng cấp đáng chú ý về độ trôi chảy hội thoại, dịch thuật thời gian thực, gọi trên desktop và phân tích tệp. Dưới đây, chúng tôi sẽ giải thích nhanh bằng một số thay đổi bạn có thể sử dụng ngay lập tức.
GPT-4o biến ChatGPT thành “trợ lý toàn năng” hơn
Định vị của GPT-4o là “omni”, tức toàn năng: ChatGPT không còn chỉ giỏi xử lý văn bản, mà đã tích hợp khả năng hiểu văn bản, hình ảnh và giọng nói vào cùng một luồng suy luận. Trải nghiệm thực tế cho thấy ChatGPT phản hồi nhanh hơn, cuộc trò chuyện trơn tru hơn, đặc biệt tiết kiệm bước trong các tình huống vừa xem vừa giải thích. Với hầu hết người dùng, sự nâng cấp này không phải là một nút bấm cụ thể, mà là “ít phải chuyển đổi công cụ hơn, ít phải sao chép-dán qua lại hơn”.
Dịch thời gian thực & hội thoại giọng nói: ChatGPT “phiên dịch” tự nhiên hơn
Trước đây, dịch thuật trên ChatGPT theo kiểu “bạn gửi một câu, nó trả lời một câu”. Giờ đây, GPT-4o nhấn mạnh hơn vào việc chuyển đổi tức thời theo phong cách hội thoại, phù hợp cho giao tiếp song ngữ và phiên dịch tại chỗ. Kết hợp với chế độ giọng nói, ChatGPT có thể chuyển đổi giữa các ngôn ngữ nhanh hơn, giảm cảm giác gián đoạn. Cần lưu ý rằng một số trải nghiệm giọng nói cao cấp hơn sẽ được mở dần theo đợt, tốc độ có đầy đủ tính năng có thể khác nhau tùy theo tài khoản và khu vực.


