Mô hình GPT-4o do OpenAI ra mắt đã đưa ChatGPT bước sang một giai đoạn hoàn toàn mới. Mô hình đa năng này tích hợp khả năng suy luận văn bản, âm thanh và thị giác. Đối với những người dùng đăng ký ChatGPT Plus, trải nghiệm GPT-4o là điểm nâng cấp đáng chú ý nhất, cho phép trò chuyện như người thật, nhận diện hình ảnh và thậm chí ghi nhớ những gì bạn đã nói.
Hội thoại giọng nói thời gian thực – tương tác như người thật
Tính năng ấn tượng nhất của GPT-4o chính là hội thoại giọng nói thời gian thực. Không còn chỉ nhận đầu vào dạng văn bản, nó có thể trực tiếp hiểu được giọng điệu và cảm xúc của bạn, chẳng hạn như nhận ra bạn vừa tập thể dục qua tiếng thở gấp. Hai GPT-4o còn có thể giao tiếp với nhau, cùng hát một bài hát, thể hiện khả năng cộng tác mạnh mẽ hơn giữa các AI.
Trải nghiệm tương tác mang tính nhân hóa này khiến việc sử dụng ChatGPT Plus hàng ngày trở nên thú vị hơn. Dù là tán gẫu hay xin lời khuyên, GPT-4o đều phản hồi tự nhiên như một người bạn, thay vì một cỗ máy hỏi đáp lạnh lùng.
Khả năng nhận diện hình ảnh giúp AI thấu hiểu thế giới
Chức năng nhận diện hình ảnh của GPT-4o cũng là một điểm sáng lớn. Nó có thể quét môi trường xung quanh qua camera, ngay lập tức cho bạn biết những vật thể nào trước mặt, thậm chí phán đoán đó là nơi làm việc của nghề nghiệp nào dựa trên các vật dụng. Điều này đặc biệt hữu ích cho người khiếm thị – GPT-4o giúp họ hiểu môi trường, báo cáo phương hướng và gọi taxi.
Trong giảng dạy, GPT-4o cũng có thể đóng vai trò như một người hướng dẫn. Nó không đưa ra câu trả lời trực tiếp mà từng bước dẫn dắt học sinh giải bài như một giáo viên thực thụ. Cách tương tác này nâng cao đáng kể hiệu quả học tập, đồng thời cho thấy tiềm năng to lớn của ChatGPT Plus trong lĩnh vực giáo dục.
