ChatGPT เพิ่งได้รับการอัปเดตครั้งใหญ่ โดยโมเดล GPT-4o เป็นฟีเจอร์ที่ได้รับความสนใจมากที่สุด GPT-4o ในฐานะโมเดลมัลติโมดัลอเนกประสงค์ เพิ่มความสามารถในการสนทนาด้วยเสียงแบบเรียลไทม์ วิเคราะห์วิดีโอ และ識別ภาพ ซึ่งเปลี่ยนวิธีที่ผู้ใช้โต้ตอบกับ AI ไปอย่างสิ้นเชิง บทความนี้จะเจาะลึกฟีเจอร์ใหม่ของ ChatGPT เพื่อให้คุณใช้ประโยชน์จากความสามารถล่าสุดได้อย่างเต็มที่
GPT-4o การสนทนามัลติโมดัล: การผสานเสียงและวิดีโออย่างลึกซึ้ง
การอัปเกรดหลักของ GPT-4o คือการเสริมความสามารถในการประมวลผลเสียงและวิดีโอ มันไม่ได้จำกัดแค่การสนทนาด้วยข้อความอีกต่อไป แต่สามารถพูดคุยแบบเรียลไทม์เหมือนมนุษย์ รับรู้อารมณ์ของผู้ใช้ผ่านน้ำเสียงและเสียงหายใจ เช่น ระบุว่าคุณเพิ่งออกกำลังกายหรือไม่ ผู้ใช้ยังสามารถแชร์หน้าจอเพื่อให้ AI วิเคราะห์เนื้อหาบนหน้าจอแบบเรียลไทม์ ซึ่งมีประโยชน์อย่างมากในการแก้ปัญหาหรือการสอน นอกจากนี้ GPT-4o รองรับการแปลระหว่างภาษาไทยและอังกฤษ ด้วยจังหวะและน้ำเสียงที่เป็นธรรมชาติทำให้การสื่อสารข้ามภาษาลื่นไหลยิ่งขึ้น
การวิเคราะห์ภาพอัจฉริยะและการเข้าใจภาพ
ฟีเจอร์ใหม่ของ ChatGPT ที่น่าประทับใจที่สุดคือการเพิ่มความสามารถในการ識別ภาพ โดยการถ่ายรูปอัปโหลด GPT-4o สามารถอธิบายสภาพแวดล้อมรอบตัว เช่น 識別อุปกรณ์ในห้องปฏิบัติการและคาดเดาสถานการณ์อาชีพ ซึ่งช่วยผู้ที่มีปัญหาทางสายตาหรือในสถานการณ์การสอนได้อย่างมาก ในการแก้โจทย์คณิตศาสตร์ โมเดล o1 Reasoning รองรับการถ่ายรูปโจทย์แล้วอัปโหลด AI จะแนะแนวทางทีละขั้นตอนแทนการให้คำตอบโดยตรง เหมาะอย่างยิ่งสำหรับโจทย์ซับซ้อนอย่างแคลคูลัส
การปรับปรุงประสิทธิภาพและการเพิ่มประสิทธิภาพเดสก์ท็อป
OpenAI ได้ปรับปรุงความเร็วและคุณภาพการตอบสนองของ GPT-4o ในการอัปเดตครั้งนี้ โดยค่าใช้จ่ายในการเรียก API ลดลงสูงสุดถึง 50% ซึ่งเป็นมิตรกับนักพัฒนาและผู้ใช้ในองค์กร นอกจากนี้ แอปพลิเคชันเดสก์ท็อป ChatGPT for Mac ได้เปิดตัวแล้ว โดยใช้คีย์ลัด Option+Space เพื่อเรียกใช้ AI ได้ทุกเมื่อ โดยไม่ต้องใช้เบราว์เซอร์ ผู้ใช้เวอร์ชันฟรีก็สามารถสัมผัส GPT-4o ได้ แต่มีข้อจำกัดในการใช้งาน เมื่อเกินจะลดระดับเป็น GPT-3.5 โดยอัตโนมัติ ฟีเจอร์ใหม่ของ ChatGPT เหล่านี้คุ้มค่าต่อการดาวน์โหลดและทดลองใช้