ในช่วงปีที่ผ่านมา OpenAI ได้อัปเดต ChatGPT ด้วยฟีเจอร์ใหม่อย่างต่อเนื่อง ตั้งแต่การโต้ตอบแบบหลายรูปแบบ (มัลติโมดัล) ไปจนถึงการให้เหตุผลเชิงลึก ซึ่งแต่ละการอัปเดตมุ่งปรับปรุงประสบการณ์ผู้ใช้ให้ดีขึ้น บทความนี้จะสรุปฟีเจอร์หลักเหล่านี้ เพื่อแสดงให้เห็นว่า ChatGPT พัฒนาจากแชทบอทข้อความธรรมดา ไปเป็นผู้ช่วยประจำวันที่รอบด้านและชาญฉลาดขึ้นได้อย่างไร
โมเดลอเนกประสงค์ GPT-4o: เปิดยุคใหม่ของการโต้ตอบแบบมัลติโมดัล
หนึ่งในอัปเกรดสำคัญของ ChatGPT คือการเปิดตัวโมเดล GPT-4o โดยตัว “o” ย่อมาจาก “omni” (อเนกประสงค์) ซึ่งหมายความว่าโมเดลสามารถผสานการให้เหตุผลจากข้อความ เสียง และภาพได้อย่างราบรื่น มันนำมาซึ่งประสบการณ์การสนทนาที่เป็นธรรมชาติเหมือนมนุษย์ ตอบสนองได้รวดเร็ว รวมถึงเข้าใจและสร้างเสียงพูดที่สื่ออารมณ์ได้
ฟังก์ชันแปลภาษาผ่านการสนทนาแบบเรียลไทม์รองรับมากกว่า 50 ภาษา สามารถทำหน้าที่เป็นล่ามที่มีประสิทธิภาพ นอกจากนี้ ความสามารถในการแชร์หน้าจอก็มีประโยชน์อย่างมาก เมื่อคุณพบปัญหาด้านการเขียนโปรแกรมหรือการใช้ซอฟต์แวร์ เพียงแชร์หน้าจอ ChatGPT ก็จะ “เห็น” ปัญหาและให้คำแนะนำผ่านเสียงได้ เหมือนมีครูพิเศษส่วนตัวที่พร้อมช่วยเหลือตลอดเวลา
แอปพลิเคชันเดสก์ทอปที่ผสานรวมอย่างสมบูรณ์ และความร่วมมือกับ Apple
เพื่อให้การโต้ตอบสะดวกยิ่งขึ้น ChatGPT ได้เปิดตัวแอปพลิเคชันเดสก์ทอปอย่างเป็นทางการ บนระบบปฏิบัติการ macOS ผู้ใช้สามารถเรียก ChatGPT ขึ้นมาได้ทันทีโดยกดปุ่ม Option+Space โดยไม่จำเป็นต้องเปิดเบราว์เซอร์ ทำให้สามารถใช้งานได้แบบฉับไวทันใจ แอปพลิเคชันนี้รองรับการอัปโหลดไฟล์และภาพจากเครื่องท้องถิ่น พร้อมสนทนาด้วยเสียงได้โดยตรง
นอกจากนี้ ความร่วมมือเชิงลึกระหว่าง OpenAI กับ Apple ยังทำให้ความสามารถของ ChatGPT ถูกผสานเข้ากับ Siri และระดับระบบปฏิบัติการ ในอนาคตผู้ใช้บนอุปกรณ์ของ Apple จะสามารถเรียกใช้ฟังก์ชันอัจฉริยะที่ขับเคลื่อนโดย GPT-4o ได้โดยตรงโดยไม่จำเป็นต้องมีบัญชี ซึ่งช่วยลดขั้นตอนการเริ่มใช้ และทำให้ผู้ช่วย AI กลายเป็นสิ่งที่มีอยู่ทุกหนแห่ง


