Mô hình đa năng GPT-4o của OpenAI đã thay đổi hoàn toàn cách con người tương tác với máy móc, trong đó chữ "o" đại diện cho "Omni" (toàn năng). Nhờ đó, ChatGPT không chỉ đơn thuần là một trợ lý văn bản, mà còn là người bạn có thể nghe, nhìn và nói chuyện. Dựa trên trải nghiệm thực tế, tôi sẽ tập trung phân tích hai tính năng hữu ích nhất: trò chuyện giọng nói và chia sẻ màn hình – xem chúng thực sự giải quyết được vấn đề gì.
Trò chuyện giọng nói tự nhiên và dịch thuật tức thì
Điều khiến tôi ấn tượng nhất ở GPT-4o là khả năng trò chuyện giọng nói cực kỳ tự nhiên. Nó có thể nhận biết giọng điệu và cảm xúc của bạn, thậm chí kiên nhẫn chờ đợi khi bạn đang ngập ngừng, không còn cứng nhắc như trước đây. Đây không chỉ là một chiêu trò – tính năng dịch thuật tức thì nâng cấp hoàn toàn mới hỗ trợ 50 ngôn ngữ, có thể thực hiện giao tiếp đa ngôn ngữ theo thời gian thực như một phiên dịch viên chuyên nghiệp. Trong các cuộc họp ở nước ngoài, tôi đã nhờ nó giải quyết không ít rắc rối.
Dù là kể chuyện trước khi ngủ cho trẻ hay làm thư ký trong cuộc họp, ChatGPT có thể điều chỉnh giọng nói và từ ngữ theo trạng thái cảm xúc của bạn. Đối với những người gặp khó khăn về ngôn ngữ hoặc cần sự đồng hành, trải nghiệm giao tiếp mang tính nhân hóa này là điều công nghệ trước đây khó có thể đạt được – nó thực sự xóa bỏ rào cản giao tiếp.
Tính năng chia sẻ màn hình – biến ChatGPT thành gia sư siêu đẳng
Khi viết lách, lập trình hay chỉnh sửa video gặp vướng mắc, trước đây bạn phải chụp ảnh màn hình hoặc gõ mô tả cho ChatGPT – rất phiền phức. Giờ đây chỉ cần bật tính năng chia sẻ màn hình, mô hình có thể đọc trực tiếp nội dung trên màn hình của bạn và phân tích vấn đề bạn đang xử lý. Tôi đã thử một lần: khi gặp lỗi trong code, nó nhìn vào màn hình và hướng dẫn bằng giọng nói cách sửa, giống hệt như có một gia sư siêu đẳng ngay bên cạnh.


