Tổng hợp tính năng mới ChatGPT: Bản dịch giọng nói GPT-4o và nâng cấp workflow trên desktop

Bản cập nhật ChatGPT lần này có trọng tâm rõ ràng: chuyển từ “chỉ có thể chat bằng văn bản” thành một bàn làm việc có thể xem, nghe, nói và xử lý trực tiếp các tệp. Xoay quanh khả năng đa phương thức của GPT-4o, ChatGPT đã được nâng cấp đáng chú ý về độ trôi chảy hội thoại, dịch thuật thời gian thực, gọi trên desktop và phân tích tệp. Dưới đây, chúng tôi sẽ giải thích nhanh bằng một số thay đổi bạn có thể sử dụng ngay lập tức.

GPT-4o biến ChatGPT thành “trợ lý toàn năng” hơn

Định vị của GPT-4o là “omni”, tức toàn năng: ChatGPT không còn chỉ giỏi xử lý văn bản, mà đã tích hợp khả năng hiểu văn bản, hình ảnh và giọng nói vào cùng một luồng suy luận. Trải nghiệm thực tế cho thấy ChatGPT phản hồi nhanh hơn, cuộc trò chuyện trơn tru hơn, đặc biệt tiết kiệm bước trong các tình huống vừa xem vừa giải thích. Với hầu hết người dùng, sự nâng cấp này không phải là một nút bấm cụ thể, mà là “ít phải chuyển đổi công cụ hơn, ít phải sao chép-dán qua lại hơn”.

Dịch thời gian thực & hội thoại giọng nói: ChatGPT “phiên dịch” tự nhiên hơn

Trước đây, dịch thuật trên ChatGPT theo kiểu “bạn gửi một câu, nó trả lời một câu”. Giờ đây, GPT-4o nhấn mạnh hơn vào việc chuyển đổi tức thời theo phong cách hội thoại, phù hợp cho giao tiếp song ngữ và phiên dịch tại chỗ. Kết hợp với chế độ giọng nói, ChatGPT có thể chuyển đổi giữa các ngôn ngữ nhanh hơn, giảm cảm giác gián đoạn. Cần lưu ý rằng một số trải nghiệm giọng nói cao cấp hơn sẽ được mở dần theo đợt, tốc độ có đầy đủ tính năng có thể khác nhau tùy theo tài khoản và khu vực.

Gọi nhanh trên desktop: Tích hợp ChatGPT vào thao tác hàng ngày

Ứng dụng desktop của ChatGPT giúp việc gọi nó ra trở nên ngắn gọn hơn, ví dụ trên macOS có thể sử dụng phím tắt (Option + Space) để gọi bất cứ lúc nào mà không cần mở trình duyệt tìm tab. Bạn có thể trực tiếp kéo thả ảnh chụp màn hình, ảnh hoặc tệp từ desktop cho ChatGPT để tiếp tục hỏi, phù hợp cho các tác vụ lặt vặt nhưng tần suất cao như tóm tắt biên bản cuộc họp, viết lại email, giải thích bảng biểu. Với những người “vừa làm vừa hỏi”, điều này mang lại cảm nhận thực tế hơn là điểm số chạy mô hình.

Nhập tệp và từ drive mượt hơn: Phân tích dữ liệu của ChatGPT giống như đang cộng tác

Trong quy trình phân tích dữ liệu, ChatGPT đã hỗ trợ nhập tệp trực tiếp từ Google Drive, Microsoft OneDrive, giảm bớt việc tải xuống rồi tải lên. Sau khi tải lên, ChatGPT có thể đọc bảng, tóm tắt, tạo ý tưởng biểu đồ, thậm chí giải thích rõ hơn các chỉ số bạn quan tâm bằng ngôn ngữ tự nhiên. Nếu bạn là người dùng miễn phí, bạn cũng thường có thể trải nghiệm các khả năng cốt lõi của GPT-4o, nhưng sau khi đạt đến một hạn mức sử dụng nhất định, ChatGPT có thể tự động chuyển về mô hình cơ bản hơn.

GPT-4o biến ChatGPT thành “trợ lý toàn năng” hơn

Dịch thời gian thực & hội thoại giọng nói: ChatGPT “phiên dịch” tự nhiên hơn

Gọi nhanh trên desktop: Tích hợp ChatGPT vào thao tác hàng ngày

Nhập tệp và từ drive mượt hơn: Phân tích dữ liệu của ChatGPT giống như đang cộng tác

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần

Tổng hợp mã lỗi phát nhạc Spotify và cách khắc phục nhanh chóng