ChatGPT vừa được nâng cấp với nhiều tính năng mới, trong đó chế độ tương tác bằng giọng nói được cải thiện đáng kể, cùng với khả năng đa phương thức của mô hình GPT-4o giúp trải nghiệm người dùng lên một tầm cao mới. Không còn là những dòng chữ lạnh lùng, ChatGPT giờ đây giống như một trợ lý thông minh có thể hiểu giọng điệu và nhìn thấy hình ảnh. Dưới đây là những thay đổi đáng chú ý nhất.
Giọng nói tự nhiên hơn: Tốc độ và ngữ điệu như người thật
Tính năng giọng nói nâng cao mới đã được điều chỉnh đáng kể về ngữ điệu và nhịp điệu, không còn cảm giác máy mọc cứng nhắc như trước. Giờ đây, nó hỗ trợ chuyển đổi ngôn ngữ ngay trong cuộc trò chuyện, ví dụ như dịch Trung-Anh, giúp giao tiếp đa ngôn ngữ trở nên cực kỳ mượt mà. Điều này rất hữu ích cho những ai cần họp với đồng nghiệp nước ngoài hoặc học ngoại ngữ – như có một phiên dịch viên bên cạnh mọi lúc.
Trong tương lai, chế độ giọng nói này sẽ được tích hợp sâu hơn vào chế độ "Projects", tạo ra một quy trình làm việc sống động hơn. Hãy tưởng tượng bạn chỉ cần nói, ChatGPT sẽ giúp bạn sắp xếp tiến độ dự án, tạo bản nháp báo cáo bằng giọng nói mà không cần gõ phím.
GPT-4o mở ra cách tương tác hoàn toàn mới: Chia sẻ màn hình và phân tích tức thì
Sự ra mắt của GPT-4o là điểm nhấn chính của bản cập nhật lần này. Nó không chỉ giới hạn ở văn bản mà còn hỗ trợ xử lý tổng hợp âm thanh, video và chữ viết. Giờ đây, bạn có thể trực tiếp chia sẻ màn hình máy tính hoặc điện thoại với ChatGPT để nó xem và đưa ra gợi ý. Ví dụ khi viết code gặp lỗi, ChatGPT có thể phân tích đoạn code trên màn hình của bạn và nói cho bạn biết lỗi ở đâu.

