ChatGPT เปิดตัวอัปเดตครั้งสำคัญด้วยโมเดล GPT-4o ที่ “o” ย่อมาจาก Omni (全能) หมายถึงความสามารถในการประมวลผลแบบหลายรูปแบบ ไม่ใช่แค่ข้อความเท่านั้น แต่รวมถึงเสียง ภาพ และวิดีโอ เมื่อเทียบกับ GPT-4 Turbo รุ่นก่อน GPT-4o พัฒนาขึ้นอย่างชัดเจนในเรื่องความลื่นไหลของการสนทนา การแปลแบบเรียลไทม์ และการโต้ตอบกับ AI ที่ให้ประสบการณ์ที่เป็นธรรมชาติและอบอุ่นยิ่งขึ้น
สนทนาลื่นไหลและแปลทันที
จุดเด่นที่สุดของ GPT-4o คือการพัฒนาการโต้ตอบด้วยเสียงที่ก้าวกระโดด ไม่เพียงแค่เข้าใจน้ำเสียงและอารมณ์ของผู้ใช้เท่านั้น แต่ยังปรับรูปแบบการตอบกลับตามความต้องการด้านเสียงได้อีกด้วย เหมือนพูดคุยกับคนจริง ๆ นอกจากนี้ รุ่นใหม่ยังรองรับการแปลสดมากถึง 50 ภาษา ทำให้การสื่อสารข้ามภาษาไม่ต้องพึ่งเครื่องมืออื่นอีกต่อไป ไม่ว่าจะเป็นการประชุมทางธุรกิจหรือการถามทางระหว่างเดินทาง แค่พูดออกมา GPT-4o ก็สามารถแปลเป็นภาษาเป้าหมายได้ทันที ขจัดอุปสรรคทางภาษาอย่างแท้จริง
ในการใช้งานประจำวัน ผู้ใช้สามารถถามด้วยเสียงได้โดยตรง โมเดลจะวิเคราะห์บริบทแบบเรียลไทม์และตอบกลับด้วยอารมณ์ที่เหมาะสม เช่น เมื่อเล่านิทานก่อนนอน มันสามารถเลียนแบบเสียงตัวละครต่าง ๆ ทำให้เรื่องราวมีชีวิตชีวาขึ้น หรือในที่ประชุม มันก็ทำหน้าที่เป็นเลขานุการอัตโนมัติ บันทึกการตัดสินใจสำคัญ ๆ ปฏิสัมพันธ์แบบหลายรูปแบบนี้ทำให้ขอบเขตการใช้งาน ChatGPT กว้างขึ้นมาก
ความสามารถด้านภาพแบบเรียลไทม์และแชร์หน้าจอ
ความสามารถด้านภาพที่เพิ่มเข้ามาใหม่ใน GPT-4o ทำให้ AI “มองเห็น” โลกได้ ผู้ใช้สามารถใช้กล้องหรือฟังก์ชันแชร์หน้าจอเพื่อให้โมเดลสังเกตภาพแบบเรียลไทม์และตอบสนอง ตัวอย่างเช่น เมื่อคุณเขียนโค้ดแล้วเจอบั๊ก เพียงแค่แชร์หน้าจอ GPT-4o ก็จะทำหน้าที่เหมือนติวเตอร์超級 วิเคราะห์โค้ดทีละบรรทัดและอธิบายสาเหตุของข้อผิดพลาดด้วยเสียง เช่นเดียวกับการตัดต่อวิดีโอหรือออกแบบรูปภาพ มันสามารถให้คำแนะนำเฉพาะตามเนื้อหาบนหน้าจอได้ ซึ่งมีประสิทธิภาพมากกว่าโหมดการอธิบายด้วยรูปภาพแบบเดิมมาก
นอกจากนี้ ChatGPT รองรับการอัปโหลดไฟล์จาก Google Drive และ OneDrive โดยตรง ผู้ใช้ยังสามารถโต้ตอบกับตารางและแผนภูมิแบบอินเทอร์แอกทีฟ และส่งออกแผนภูมิที่ปรับแต่งได้ การอัปเดตนี้ช่วยเพิ่มประสิทธิภาพการวิเคราะห์ข้อมูลอย่างมาก เหมาะสำหรับพนักงานออฟฟิศที่ต้องจัดการกับรายงานบ่อย ๆ


