ChatGPT vừa có bản nâng cấp tính năng lớn, mô hình mới nhất GPT-4o (mô hình đa năng) đã được mở hoàn toàn. Người dùng giờ đây có thể trò chuyện bằng giọng nói tự nhiên hơn, chia sẻ màn hình trực tiếp và chỉnh sửa code ngay trong các công cụ phát triển. Những tính năng mới này biến ChatGPT từ một chatbot đơn thuần thành một trợ lý thông minh thực sự có khả năng hiểu thông tin đa phương thức và đồng hành tận tâm. Dù bạn là người dùng miễn phí hay người đăng ký trả phí, đều có thể trải nghiệm những thay đổi thú vị này. Bài viết sẽ tổng hợp đầy đủ các tính năng cốt lõi mới.
Khả năng đa phương thức của GPT-4o: Tích hợp hoàn chỉnh giọng nói, hình ảnh và văn bản
GPT-4o kết hợp hoàn toàn khả năng suy luận âm thanh, video và văn bản thành một mô hình đa năng thực thụ. So với GPT-4 Turbo thế hệ trước, tốc độ API của GPT-4o nhanh gấp đôi, chi phí giảm 50% và phản hồi gần như tức thời. Người dùng không chỉ giao tiếp bằng văn bản mà còn có thể tải lên hình ảnh, tệp để AI phân tích, thậm chí dùng camera để ChatGPT mô tả cảnh vật xung quanh theo thời gian thực, hỗ trợ người khiếm thị nhận biết môi trường. Hai phiên bản GPT-4o thậm chí có thể trò chuyện với nhau, hát song ca, cho thấy tiềm năng cộng tác mạnh mẽ hơn giữa các AI.
Hội thoại giọng nói tự nhiên hơn, nhận diện giọng điệu và cảm xúc
Chế độ giọng nói mới của ChatGPT đã được nâng cấp đáng kể, trải nghiệm trò chuyện sống động như đang nói chuyện với bạn bè thật. Nó có thể nhận ra cảm xúc ẩn sau giọng điệu của người dùng, đồng thời phản ứng phù hợp với các âm thanh như thở gấp, tiếng cười. Trong giảng dạy, GPT-4o có thể hướng dẫn học sinh từng bước giải quyết vấn đề như một giáo viên, thay vì đưa ra câu trả lời trực tiếp, giúp nâng cao hiệu quả học tập. Ngoài ra, khả năng ghi nhớ được cải thiện cho phép ChatGPT lưu lại thói quen và sở thích của người dùng, mang đến những phản hồi cá nhân hóa hơn.

