บอกตามตรงว่า OpenAI อัปเดต ChatGPT ครั้งนี้ใหญ่ไม่น้อย การเปิดให้ใช้โมเดล GPT-4o อย่างเต็มรูปแบบทำให้ผู้ใช้หลายคนตื่นเต้น ในฐานะคนที่ใช้ฟีเจอร์ใหม่เหล่านี้เป็นกลุ่มแรก ผมอยากพูดถึงฟีเจอร์ที่เปลี่ยนประสบการณ์การใช้งานจริงๆ โดยเฉพาะการโต้ตอบหลายรูปแบบ (Multimodal) และการแชร์หน้าจอ ซึ่งทำให้ ChatGPT จากผู้ช่วยแค่ข้อความธรรมดากลายเป็นเครื่องมืออเนกประสงค์ที่ครบเครื่อง
การโต้ตอบหลายรูปแบบของ ChatGPT และฟังก์ชันแปลภาษาทันที
ความสามารถหลายรูปแบบของ GPT-4o ไม่ใช่แค่การดูรูปภาพเท่านั้น จุด突破ที่สำคัญที่สุดคือสามารถประมวลผลเสียง ข้อความ และวิดีโอได้พร้อมกัน เมื่อคุณพูดกับมันโดยตรง มันสามารถรับรู้น้ำเสียงและอารมณ์ของคุณ และน้ำเสียงตอบกลับก็จะมีความเป็นมนุษย์มากขึ้น เช่น ถ้าคุณพูดว่า "ช่วยเขียนอีเมลให้หน่อย" ด้วยเสียงเหนื่อยๆ มันก็จะตอบกลับด้วยน้ำเสียงที่นุ่มนวลกว่า
อีกหนึ่งอัปเกรดที่ใช้งานได้จริงคือการแปลภาษาทันที แม้ว่า ChatGPT เวอร์ชันเก่าจะแปลได้ แต่ GPT-4o สามารถแปลแบบ real-time ได้ รองรับ 50 ภาษา สลับภาษาในระหว่างสนทนาได้โดยแทบไม่มีดีเลย์ ผมลองพูดผสมไทย-อังกฤษ มันตอบสนองเร็วมาก
การสื่อสารอัตโนมัติระหว่าง AI และประสบการณ์โต้ตอบเชิงลึก
สิ่งที่ทำให้ผมประหลาดใจที่สุดใน GPT-4o คือ AI สามารถสนทนากันเองได้ เช่น ให้มันเล่นเป็นสองบทบาทที่แตกต่างกัน กำหนดจุดยืนให้โต้แย้งกัน แล้วปล่อยให้ทั้งสองสนทนากันเองโดยแทบไม่ต้องแทรกแซง การโต้ตอบเชิงลึกแบบนี้มีประโยชน์มากสำหรับการระดมสมอง คุณสามารถให้ AI ตัวหนึ่งเสนอแผนแบบอนุรักษ์นิยม และอีกตัวเสนอแผนรุก แล้วมันก็จะวิเคราะห์ข้อดีข้อเสียให้คุณเอง


