Trong đợt cập nhật mùa xuân vừa qua, OpenAI đã chính thức công bố mô hình mới có tên GPT-4o. Chữ “o” trong tên gọi đại diện cho “omni” (toàn năng), ám chỉ lần đầu tiên một mô hình AI duy nhất tích hợp khả năng hiểu và tạo ra nội dung từ văn bản, âm thanh lẫn hình ảnh. Đây không phải là một bản nâng cấp thông thường, mà là một bước nhảy vọt về độ mượt mà và trí tuệ trong tương tác giữa người và máy, mang đến trải nghiệm chưa từng có cho mọi người dùng, kể cả phiên bản miễn phí.
Trải nghiệm hội thoại đa phương thức tự nhiên
Bước tiến dễ nhận thấy nhất của GPT-4o nằm ở độ tự nhiên trong hội thoại. Nó có thể giao tiếp với tốc độ phản hồi gần như con người, thậm chí cảm nhận và bắt chước theo tông giọng, cảm xúc của người dùng. Dù bạn tương tác bằng giọng nói hay văn bản, cuộc trò chuyện đều giống như với một người bạn thực sự, chứ không còn là giao tiếp văn bản khô cứng nữa. Sự tiến bộ này giúp nó có thể đóng những vai trò sống động hơn, chẳng hạn như kể những câu chuyện trước giờ đi ngủ giàu cảm xúc, hoặc trở thành một người bạn học tận tâm.
Đồng thời, chức năng dịch thuật thời gian thực của nó cũng được cải thiện vượt bậc. Dù phiên bản cũ đã có thể dịch, GPT-4o hỗ trợ chuyển đổi nhanh chóng giữa tới 50 ngôn ngữ, kết hợp với khả năng đối thoại bằng giọng nói mới, cho phép thực hiện phiên dịch trực tiếp gần như đồng thời. Điều này khiến công việc giao tiếp đa ngôn ngữ, trò chuyện khi du lịch hay học ngoại ngữ trở nên cực kỳ dễ dàng, thực sự phá bỏ rào cản ngôn ngữ.
“Gia sư toàn năng” biết nhìn thế giới
Trọng tâm của mô hình “toàn năng” nằm ở khả năng đa phương thức. Giờ đây, bạn có thể trực tiếp tải lên ChatGPT các hình ảnh, tài liệu, bảng tính hay cả file trình chiếu, để nó phân tích nội dung, tóm tắt thông tin hoặc trả lời các câu hỏi liên quan. Mạnh mẽ hơn nữa, thông qua tính năng chia sẻ màn hình, nó có thể “nhìn thấy” lỗi lập trình bạn gặp phải trên màn hình máy tính, các vấn đề thao tác phần mềm và đưa ra hướng dẫn bằng giọng nói hoặc văn bản ngay lập tức, giống như một gia sư siêu cấp luôn sẵn sàng.


