Titikey
Trang chủMẹo hayChatGPTKhám phá các tính năng đa phương thức mới của ChatGPT: Giọng nói nâng cao, Chia sẻ màn hình và Tìm kiếm trong trò chuyện

Khám phá các tính năng đa phương thức mới của ChatGPT: Giọng nói nâng cao, Chia sẻ màn hình và Tìm kiếm trong trò chuyện

8/2/2026
ChatGPT

Bài viết này phân tích chi tiết một số tính năng mới thực tế nhất của ChatGPT thời gian gần đây: từ hội thoại bằng giọng nói tự nhiên hơn, cộng tác trên phiên bản dành cho máy tính để bàn, cho đến tìm kiếm trong trò chuyện và kiểm soát bộ nhớ. Bạn không cần phải thay đổi toàn bộ cách sử dụng, chỉ cần nắm rõ điểm truy cập và các giới hạn là có thể tiết kiệm thời gian một cách rõ rệt.

1. Trải nghiệm "Đầu vào & Đầu ra trong một hệ thống duy nhất" từ GPT-4o

ChatGPT hiện nay chú trọng hơn vào việc tích hợp đa phương thức: văn bản, hình ảnh và giọng nói có thể được kết hợp liền mạch trong cùng một đoạn hội thoại. Trải nghiệm thực tế là, bạn gửi một ảnh chụp màn hình và bổ sung thêm một lời giải thích bằng giọng nói, ChatGPT có thể hiểu cả hai như một nhiệm vụ duy nhất, không cần bạn phải "dịch" qua lại thành văn bản thuần túy.

Nếu bạn thường xuyên tổng hợp tài liệu, xem biểu đồ, chỉnh sửa văn bản, quy trình làm việc kết hợp kiểu này sẽ trơn tru hơn so với việc mở nhiều công cụ riêng lẻ. Khi sử dụng, hãy nhớ nói rõ nhu cầu: bạn muốn nó "giải thích", "đúc kết ý chính" hay "tạo ra kết luận có thể sao chép", thì đầu ra sẽ ổn định hơn.

2. Giọng nói nâng cao: Có thể ngắt lời, phản hồi nhanh hơn và giống cuộc trò chuyện hơn

Chế độ giọng nói của ChatGPT không còn chỉ là "chuyển giọng nói thành văn bản rồi trả lời", trọng tâm nằm ở nhịp độ hội thoại tự nhiên hơn. Bạn có thể chen ngang để điều chỉnh hướng đi khi nó đang nói dở, giảm thiểu sự lãng phí "chờ nó nói xong rồi làm lại từ đầu".

Để ChatGPT sử dụng giọng nói hiệu quả hơn, nên đặt câu hỏi bằng các câu ngắn phân đoạn, ví dụ: "Trước tiên hãy tóm tắt, sau đó đưa ra ba đề xuất cho tôi". Khi gặp môi trường ồn ào, việc kiểm tra quyền microphone của hệ thống và chọn đúng thiết bị đầu vào sẽ hiệu quả hơn là kết nối lại nhiều lần.

3. Ứng dụng trên máy tính để bàn: Đưa ảnh chụp màn hình, tệp tin và những gì bạn đang làm vào cuộc trò chuyện

ChatGPT trên máy tính để bàn phù hợp hơn cho việc "vừa làm vừa hỏi". Tình huống điển hình là: thả đoạn email, ảnh chụp màn hình hoặc tệp tin vào cuộc trò chuyện, để ChatGPT giúp bạn soạn thảo phản hồi, đúc kết điểm rủi ro, hoặc giải thích rõ kết luận từ bảng biểu.

Nếu liên quan đến tài liệu nhạy cảm, nên loại bỏ thông tin nhạy cảm trước khi tải lên, và làm rõ trong gợi ý "chỉ tóm tắt/chỉ đưa ra cấu trúc không diễn giải lại nguyên văn". Cách này vừa tận dụng được khả năng xử lý của ChatGPT, vừa giảm thiểu việc tiết lộ thông tin không cần thiết.

4. Tìm kiếm lịch sử trò chuyện và Tìm kiếm trên web: Tìm lại kết luận cũ, bổ sung thông tin mới

Tìm kiếm lịch sử trò chuyện khiến ChatGPT giống một "nhật ký công việc" hữu dụng hơn. Bạn có thể dùng từ khóa để tìm lại phương án, câu lệnh gợi ý (prompt), hoặc các bước xử lý sự cố trước đây, tiếp tục lặp lại trong chuỗi hội thoại gốc mà không cần phải trình bày lại bối cảnh.

Tìm kiếm trên web thì phù hợp khi cần thông tin cập nhật: ví dụ như thay đổi sản phẩm, điều khoản chính sách, hoặc nội dung mới phát hành. Khi sử dụng, hãy yêu cầu ChatGPT cung cấp nguồn chính và giải thích căn cứ, sau đó bạn nhanh chóng kiểm tra lại trang web gốc, hiệu suất thường cao hơn việc tự mình lật qua hàng chục liên kết.

5. Tính năng và Kiểm soát Bộ nhớ: Để ChatGPT ghi nhớ phần hữu ích cho bạn

Tính năng bộ nhớ của ChatGPT sẽ ghi nhớ một số sở thích lâu dài, ví dụ như phong cách viết thường dùng, vai trò công việc hoặc thói quen định dạng của bạn, và nhắc bạn khi cập nhật bộ nhớ. Bạn cũng có thể xem, xóa từng mục nhớ trong cài đặt, hoặc trực tiếp tắt tính năng bộ nhớ, duy trì mỗi cuộc trò chuyện "bắt đầu từ số không".

Cách dùng ổn định hơn là: chỉ để ChatGPT ghi nhớ "sở thích" và "định dạng", đừng ghi nhớ thông tin nhạy cảm cụ thể như tài khoản, thông tin khách hàng. Khi cần nó ghi nhớ điều gì, hãy nói trực tiếp "Hãy ghi nhớ: Tôi sẽ luôn dùng cấu trúc ba đoạn để xuất kết quả", điều này dễ kiểm soát hơn là mong đợi nó tự đoán.

Trang chủCửa hàngĐơn hàng