OpenAI เปิดตัวโมเดล ChatGPT-4o โดยที่ “o” ย่อมาจาก “omni” (รอบด้าน) ซึ่ง突破了ขีดจำกัดของการโต้ตอบแบบข้อความล้วนๆ โมเดลนี้ผสานความสามารถในการประมวลผลเสียง วิดีโอ และข้อความเข้าด้วยกัน ทำให้ผู้ใช้สามารถโต้ตอบกับ AI แบบเรียลไทม์ผ่านเสียง ภาพ หรือแม้แต่การแชร์หน้าจอ ไม่ว่าจะเป็นการสนทนาทั่วไป การช่วยเหลือด้านการเรียน หรือการทำงานร่วมกัน ChatGPT-4o มอบประสบการณ์มัลติโหมดที่แท้จริง
การสนทนาที่เป็นธรรมชาติและการแปลแบบทันที
การเปลี่ยนแปลงที่เห็นได้ชัดที่สุดของ ChatGPT-4o คือการสนทนาที่เป็นธรรมชาติมากขึ้น โมเดลสามารถตรวจจับน้ำเสียง อารมณ์ และตอบกลับอย่างเข้าใจบริบท พร้อมกันนี้ โมเดลรุ่นใหม่รองรับมากกว่า 50 ภาษา สามารถสลับระหว่างภาษาได้อย่างรวดเร็ว และรองรับการแปลสด ตัวอย่างเช่น คุณสามารถถามเป็นภาษาไทย แล้วรับคำตอบเป็นภาษาอังกฤษ โดยระหว่างนั้นระบบจะแปลเนื้อหาการสนทนาโดยอัตโนมัติ ช่วยขจัดอุปสรรคในการสื่อสารข้ามภาษา
การรับรู้ทางภาพและการวิเคราะห์การแชร์หน้าจอ
เมื่อก่อนการวิเคราะห์รูปภาพหรือวิดีโอต้องแคปหน้าจอแล้วอัปโหลดด้วยตนเอง แต่ตอนนี้ ChatGPT-4o สามารถ “มองเห็น” ภาพจากกล้องหรือเนื้อหาที่แชร์หน้าจอได้โดยตรง เมื่อคุณเจอปัญหาโค้ดที่ผิดพลาด 剪辑ที่สะดุด หรือปัญหาการใช้งานซอฟต์แวร์ เพียงแค่เปิดการแชร์หน้าจอและอธิบายปัญหาด้วยเสียง โมเดลจะวิเคราะห์ภาพแบบเรียลไทม์และให้แนวทางแก้ไข ฟีเจอร์นี้มีประโยชน์อย่างยิ่งสำหรับการทำงานร่วมกันระยะไกลและการสนับสนุนด้านเทคนิค เสมือนมีติวเตอร์ส่วนตัวที่พร้อมช่วยเหลือตลอดเวลา


