Gần đây ChatGPT đã có một loạt bản cập nhật quan trọng, từ khả năng đa phương thức của GPT-4o đến việc bổ sung dòng mô hình suy luận o, khiến trợ lý AI này trở nên toàn diện hơn. Dù bạn là người dùng thông thường hay nhà sáng tạo chuyên nghiệp, những tính năng mới này đều giúp nâng cao hiệu quả công việc và trải nghiệm tương tác. Bài viết này sẽ phân tích từng thay đổi đáng chú ý.
GPT-4o nâng cấp toàn diện: Tương tác đa phương thức tự nhiên hơn
GPT-4o – mô hình hàng đầu toàn năng của OpenAI – đã chính thức được mở cho tất cả người dùng, cả bản miễn phí và Plus đều có thể trải nghiệm. Nó không chỉ giới hạn ở văn bản, mà còn tích hợp khả năng xử lý giọng nói, hình ảnh và video. Ví dụ, bạn có thể chụp ảnh để GPT-4o nhận diện vật thể trong cảnh, hoặc tải lên file PDF để nó phân tích dữ liệu giúp bạn.
Điều bất ngờ nhất là chế độ hội thoại bằng giọng nói, độ trễ tương tác đã giảm đáng kể, nghe như đang trò chuyện với người thật. GPT-4o còn có thể nhận biết trạng thái cảm xúc của bạn qua giọng điệu, đưa ra phản hồi đồng cảm hơn trong giao tiếp. Nếu bạn chưa thử, hãy để nó luyện ngoại ngữ cùng bạn hoặc hướng dẫn con bạn làm bài tập toán.
Mô hình suy luận o3 và o4-mini chính thức ra mắt
OpenAI đã công bố dòng mô hình o3 và o4-mini, được thiết kế riêng cho các tác vụ suy luận phức tạp và phân tích sâu. o3 có khả năng "suy nghĩ bằng hình ảnh", kết hợp công cụ Python để xử lý các yếu tố thị giác, phù hợp với những nhiệm vụ khó như nghiên cứu học thuật và suy luận logic. Trong khi đó, o4-mini tập trung vào hiệu suất cao, tăng tốc độ phản hồi đáng kể mà vẫn đảm bảo chất lượng suy luận.

