Thú thật, OpenAI đã có những bước cập nhật khá lớn cho ChatGPT gần đây, và việc mở toàn bộ mô hình GPT-4o khiến nhiều người dùng thực sự ấn tượng. Là một trong những người sớm sử dụng các tính năng mới này, tôi muốn chia sẻ vài điểm khiến trải nghiệm thay đổi rõ rệt, đặc biệt là tương tác đa phương thức và chia sẻ màn hình – hai thứ giúp ChatGPT từ một trợ lý văn bản thuần túy trở thành công cụ toàn năng thực thụ.
Tương tác đa phương thức ChatGPT và tính năng dịch thuật tức thời
Khả năng đa phương thức của GPT-4o không chỉ đơn thuần là nhận diện hình ảnh – đột phá lớn nhất là nó có thể xử lý đồng thời giọng nói, văn bản và video. Bạn chỉ cần nói trực tiếp với nó, nó có thể nhận ra giọng điệu và cảm xúc, ngữ điệu phản hồi cũng mang chất người hơn. Ví dụ, khi bạn mệt mỏi nói "giúp tôi viết một email", nó sẽ đáp lại bằng giọng nhẹ nhàng hơn.
Một nâng cấp hữu ích khác là dịch thuật tức thời. Dù phiên bản cũ của ChatGPT cũng có thể dịch, nhưng GPT-4o giờ đây có thể phiên dịch trực tiếp theo thời gian thực, hỗ trợ 50 ngôn ngữ, và khi chuyển đổi ngôn ngữ giữa cuộc trò chuyện hầu như không có độ trễ. Tôi đã thử nói lẫn lộn tiếng Việt và tiếng Anh, phản hồi của nó khá nhanh.
AI tự trò chuyện với nhau và trải nghiệm tương tác sâu
Điều làm tôi bất ngờ nhất ở GPT-4o là khả năng AI có thể tự giao tiếp với nhau. Ví dụ, tôi yêu cầu nó đóng hai vai khác nhau, thiết lập lập trường tranh luận, rồi để chúng tự đối thoại qua lại mà tôi gần như không can thiệp. Kiểu tương tác sâu này rất hữu ích cho việc động não ý tưởng: bạn có thể để một AI đưa ra phương án bảo thủ, AI kia theo hướng cấp tiến, và chúng tự phân tích hết ưu nhược điểm.
Chia sẻ màn hình – thủ thuật thực chiến giải quyết lỗi lập trình
Nếu bạn viết code hoặc chỉnh sửa hình ảnh, chia sẻ màn hình thực sự là một tính năng "bom tấn". Trước đây gặp bug phải copy-paste code hoặc chụp ảnh màn hình gửi cho ChatGPT, giờ chỉ cần chia sẻ trực tiếp màn hình. GPT-4o có thể đọc nội dung trên màn hình của bạn theo thời gian thực, bao gồm lỗi Python, bản thiết kế, thậm chí cả timeline chỉnh sửa video. Bạn vừa chỉ vào điểm có vấn đề trên màn hình vừa hỏi bằng giọng nói, nó sẽ hướng dẫn từng bước giống như một gia sư.
Thực tế, phiên bản ChatGPT dành cho macOS đã có thể chỉnh sửa code trực tiếp trong Xcode, VS Code, hỗ trợ người dùng Plus và Pro. Tôi đã thử viết một đoạn logic JavaScript phức tạp, nó xác định vị trí và sửa ngay trong file dự án của tôi, tiết kiệm vô số công copy-paste.
Gia sư cá nhân và công nghệ nhân văn giá rẻ dễ tiếp cận
GPT-4o được nhiều người dùng xem như gia sư 1-1. Bạn chia sẻ màn hình bài toán hoặc bài vật lý, nó có thể giải thích từng bước, thậm chí dùng nhiều cách khác nhau giảng đi giảng lại cho đến khi bạn hiểu. Đối với người khiếm thị, GPT-4o có thể mô tả trực tiếp hình ảnh trong camera, ví dụ "trước mặt ba mét có một cái ghế, hướng về phía trước bên trái của bạn" – những chỉ dẫn chính xác như vậy. Sự quan tâm công nghệ này khiến AI không chỉ là công cụ sản xuất mà còn khá ấm áp.
Tất nhiên, những tính năng này cũng có thể trải nghiệm ở phiên bản miễn phí, nhưng bị giới hạn số lần dùng, vượt quá sẽ bị chuyển về GPT-3.5. Nếu nhu cầu sử dụng hàng ngày cao, nâng cấp lên ChatGPT Plus sẽ mượt mà hơn – vì mỗi ba giờ được gửi 80 tin nhắn, và còn có thể dùng mô hình suy luận mới nhất để xử lý các phân tích phức tạp.