Mô hình GPT-4o do OpenAI ra mắt, chữ "o" viết tắt của omni (đa năng), cho thấy ChatGPT không chỉ giới hạn ở giao tiếp bằng văn bản, mà đã tích hợp khả năng suy luận từ âm thanh, video và văn bản. Với bản nâng cấp tính năng mới này, ngay cả người dùng miễn phí cũng có thể trải nghiệm tương tác đa phương thức.
Dịch thời gian thực – Xóa bỏ rào cản ngôn ngữ
Phiên bản GPT-4o mới nắm vững 50 ngôn ngữ, có thể chuyển đổi nhanh chóng giữa các ngôn ngữ khác nhau. Kết hợp với tính năng hội thoại mượt mà hơn, ChatGPT giờ đây có thể thực hiện phiên dịch tức thì, dù là trong cuộc họp kinh doanh hay giao tiếp du lịch, giao tiếp xuyên ngôn ngữ trở nên dễ dàng hơn rất nhiều. Tính năng mới này của ChatGPT cho kết quả dịch tự nhiên hơn phiên bản cũ, độ chính xác nhận dạng giọng nói cũng được cải thiện đáng kể.
Chia sẻ màn hình – Giải quyết lỗi code và chỉnh sửa video
Trước đây, khi gặp lỗi code hoặc khó khăn trong chỉnh sửa video, bạn thường phải gõ chữ hoặc chụp ảnh màn hình để mô tả vấn đề. Giờ đây, GPT-4o có thể đọc trực tiếp nội dung màn hình được chia sẻ, vừa phân tích vừa trả lời bằng giọng nói, giống như một gia sư chuyên nghiệp. Trong thử nghiệm thực tế, khi dùng nó để tìm lỗi cú pháp Python, từ lúc chia sẻ màn hình đến khi nhận được đề xuất sửa lỗi, toàn bộ quá trình chưa đầy 30 giây.


