การอัปเกรดที่น่าสนใจที่สุดของ ChatGPT ในช่วงนี้คือการเปิดตัวโมเดล GPT-4o อย่างเต็มรูปแบบ การอัปเดตครั้งนี้ไม่ใช่แค่การเปลี่ยนเวอร์ชันเท่านั้น แต่เป็นการก้าวเข้าสู่ยุคใหม่ของ AI ที่สามารถประมวลผลข้อมูลแบบองค์รวม ทั้งเสียง ภาพ และข้อความ ทำให้การโต้ตอบระหว่างมนุษย์และเครื่องเป็นธรรมชาติและมีประสิทธิภาพมากขึ้นในทุกสถานการณ์
การสนทนาธรรมชาติแบบหลายรูปแบบที่ข้ามพรมแดนของประสาทสัมผัส
ความก้าวหน้าหลักของ GPT-4o อยู่ที่ความสามารถในการประมวลผล "แบบองค์รวม" (Omni) ซึ่งหมายความว่าตอนนี้มันสามารถรับและประมวลผลข้อมูลข้อความ เสียง และภาพได้พร้อมกัน และสร้างคำตอบที่เหมาะสมได้ คุณไม่จำเป็นต้องแบ่งการสนทนาเป็นการพิมพ์ ฟังเสียง หรือส่งภาพอีกต่อไป แต่สามารถสื่อสารด้วยวิธีต่าง ๆ อย่างเป็นธรรมชาติเหมือนพูดคุยกับคนจริง
ตัวอย่างเช่น คุณสามารถพูดถามคำถามผ่านโทรศัพท์มือถือ พร้อมทั้งใช้กล้องแสดงวัตถุหรือเอกสารที่อยู่ตรงหน้า ChatGPT จะเข้าใจคำถามจากเสียงและวิเคราะห์ข้อมูลภาพที่คุณให้มา จากนั้นให้คำตอบที่รวมทุกข้อมูลเข้าด้วยกัน ประสบการณ์การสนทนาที่ลื่นไหลและใช้หลายประสาทสัมผัสพร้อมกันนี้ ช่วยลดความซับซ้อนในการใช้งาน ทำให้การโต้ตอบระหว่างมนุษย์และเครื่องเป็นไปอย่างง่ายดายและเป็นธรรมชาติ
ตัวช่วยสมทบแบบเรียลไทม์: จากการแปลภาษาไปจนถึงการวิเคราะห์หน้าจอ
ด้วยความสามารถหลายรูปแบบที่ผสานเข้าด้วยกัน GPT-4o ได้สร้างฟังก์ชันช่วยเหลือแบบเรียลไทม์ที่ทรงพลัง หนึ่งในจุดเด่นคือการแปลภาษาแบบเรียลไทม์ ที่สามารถจัดการบทสนทนาระหว่างภาษาต่าง ๆ ได้อย่างลื่นไหล สร้างความสะดวกสำหรับการสื่อสารข้ามภาษา การอัปเกรดที่ใช้งานได้จริงมากขึ้นแสดงให้เห็นในฟังก์ชัน "แบ่งปันหน้าจอ"
เมื่อคุณพบข้อผิดพลาดในการเขียนโปรแกรม ปัญหาการใช้งานซอฟต์แวร์ หรือเนื้อหาหน้าจอใด ๆ ที่ต้องการคำแนะนำ ตอนนี้คุณสามารถแบ่งปันหน้าจอของคุณให้ ChatGPT ได้โดยตรง มันจะสามารถ "เห็น" เนื้อหาบนหน้าจอของคุณแบบเรียลไทม์ เข้าใจองค์ประกอบอินเตอร์เฟซหรือโค้ดข้อผิดพลาดที่คุณชี้ให้ดู และให้วิธีแก้ไขเป็นขั้นตอนผ่านเสียงหรือข้อนวน เหมือนมีผู้เชี่ยวชาญคอยให้คำแนะนำตลอดเวลา


