OpenAI vừa tung ra hai bản cập nhật quan trọng cho ChatGPT: mô hình đa năng GPT-4o và giao diện cộng tác Canvas. GPT-4o giúp AI thực sự “nhìn” và “nghe” thế giới, trong khi Canvas biến việc sáng tạo nội dung và lập trình trở nên mượt mà như đang làm việc cùng đồng đội. Bài viết này sẽ phân tích chi tiết những tính năng mới và cách chúng thay đổi trải nghiệm sử dụng hàng ngày.
Khả năng tương tác đa phương thức của GPT-4o
Chữ “o” trong GPT-4o đại diện cho “omni” (toàn năng), không còn bị giới hạn ở văn bản. Mô hình hỗ trợ hội thoại giọng nói thời gian thực, có thể cảm nhận được giọng điệu và cảm xúc, thậm chí thực hiện phiên dịch tức thời – thành thạo 50 ngôn ngữ, bạn nói tiếng Trung, AI sẽ trực tiếp đọc phiên dịch tiếng Anh. Tính năng hữu ích hơn cả là chia sẻ màn hình: khi gặp lỗi lập trình hoặc vấn đề chỉnh sửa video, chỉ cần chia sẻ màn hình, GPT-4o sẽ “nhìn” thao tác của bạn và đưa ra hướng dẫn bằng giọng nói, giống như một gia sư siêu cấp trực tuyến.
Ngoài ra, GPT-4o còn có khả năng hiểu thị giác, có thể nhận diện cảnh vật qua camera, giúp người khiếm thị “nghe” được môi trường xung quanh. Những khả năng này biến ChatGPT từ một công cụ trò chuyện thành một người bạn AI có thể nhìn, nghe và hướng dẫn.
Canvas: Đồng hành sáng tạo như một người huấn luyện
Canvas là một cửa sổ cộng tác độc lập, loại bỏ hoàn toàn giao diện hội thoại truyền thống. Khi bạn viết bài dài hoặc viết mã, Canvas cung cấp các ghi chú nội dòng, đề xuất chỉnh sửa và chức năng chỉnh sửa trực tiếp. Ví dụ khi viết bài, bạn có thể chọn một đoạn văn để AI trau chuốt, điều chỉnh giọng điệu, thậm chí chuyển đổi thành bảng hoặc thơ chỉ với một cú nhấp chuột; khi viết mã, Canvas hỗ trợ kiểm tra mã, sửa lỗi và chuyển đổi ngôn ngữ (ví dụ từ Python sang JavaScript). Tất cả các thay đổi đều được lưu giữ lịch sử phiên bản, bạn có thể quay lại bất kỳ lúc nào.


