Chữ "o" trong ChatGPT-4o đại diện cho "omni" (toàn năng). Mô hình này không còn bị giới hạn ở văn bản, mà tích hợp khả năng suy luận trên cả âm thanh, video và chữ viết, giúp tương tác trở nên tự nhiên hơn. So với thế hệ trước GPT-4 Turbo, ChatGPT-4o có sự cải thiện rõ rệt về tốc độ phản hồi và khả năng hiểu đa phương thức, mở rộng đáng kể các tình huống ứng dụng AI.
Hội thoại giọng nói thời gian thực & dịch đa ngôn ngữ
ChatGPT-4o nâng cấp tính năng hội thoại giọng nói thời gian thực, cho phép người dùng trò chuyện trực tiếp bằng giọng nói với AI với tốc độ phản hồi gần như con người. Tính năng này hỗ trợ hơn 50 ngôn ngữ, có thể phiên dịch tức thì, giúp xóa bỏ rào cản ngôn ngữ trong các cuộc họp quốc tế hay giao tiếp hàng ngày.
Ngoài ra, mô hình còn có thể nhận biết giọng điệu và cảm xúc, điều chỉnh giọng nói và phong cách phản hồi theo yêu cầu của người dùng, mang lại sự tương tác ấm áp và giàu tính nhân văn hơn.
Chia sẻ màn hình & chế độ cộng tác AI mới
Tính năng mới này cho phép người dùng chia sẻ trực tiếp nội dung màn hình, ChatGPT-4o có thể đọc thông tin trên màn hình ngay lập tức. Ví dụ khi viết code hoặc chỉnh sửa video, AI có thể phân tích lỗi hiển thị trên màn hình và đưa ra giải pháp từng bước bằng giọng nói, giống như một gia sư siêu cấp ngay tại chỗ.
Thiết kế này giúp hỗ trợ kỹ thuật trở nên trực quan hơn, không cần phải gõ chữ hay chụp ảnh màn hình để mô tả vấn đề.


