Sau khi dùng thử các tính năng mới của ChatGPT một cách liên tục, điều khiến tôi bất ngờ nhất là sự nâng cấp toàn diện về năng lực đa phương thức của GPT-4o. Dù là đối thoại giọng nói thời gian thực, hỗ trợ lập trình qua chia sẻ màn hình, hay tính năng tìm kiếm ghi nhớ và quản lý thư viện ảnh mới, tất cả đều giúp nâng hiệu suất sử dụng hàng ngày lên một tầm cao mới. Sau đây là một vài tình huống thực tế khiến tôi ấn tượng sâu sắc.
Phiên dịch tức thì: Giao tiếp đa ngôn ngữ không còn trở ngại
Trước đây khi dùng ChatGPT để dịch, tôi phải copy-paste thủ công. Giờ đây chỉ cần bật đối thoại giọng nói, tôi nói tiếng Trung, nó trả lời bằng tiếng Anh gần như không độ trễ. Trong một cuộc họp trực tuyến với đồng nghiệp nước ngoài, tôi thử để ChatGPT làm phiên dịch đồng thời. Dù đôi lúc có sai sót nhỏ, nhưng độ trôi chảy tổng thể vượt xa tưởng tượng. Nó thành thạo hơn 50 ngôn ngữ, và có thể điều chỉnh giọng điệu theo ngữ cảnh – dùng từ cẩn trọng trong môi trường trang trọng, hoặc thoải mái hơn khi trò chuyện bạn bè. Với những người thường xuyên giao tiếp đa ngôn ngữ, tính năng này thực sự là nhu cầu thiết yếu.
Chia sẻ màn hình: “Gia sư siêu cấp” cho viết code và dựng video
Phiên bản mới của ChatGPT hỗ trợ chia sẻ màn hình. Khi gặp lỗi code, chỉ cần mở Xcode hoặc VS Code, nó sẽ đọc nội dung màn hình theo thời gian thực và đưa ra gợi ý sửa lỗi. Tôi thử nhờ nó tối ưu một đoạn script Python, nó vừa phân tích vừa giải thích logic bằng giọng nói, như có người ngồi cạnh chỉ dẫn. Tương tự, khi dựng video gặp tình trạng giật lag do hiệu ứng, tôi chia sẻ timeline cho nó, nó lập tức chỉ ra plugin nào đang chiếm tài nguyên quá mức. Cách tương tác kết hợp hình ảnh và giọng nói này hiệu quả hơn nhiều so với cách chụp ảnh màn hình và gõ chữ trước đây.


