Titikey
หน้าแรกเคล็ดลับดีๆChatGPTเปิดฟีเจอร์ใหม่ ChatGPT: GPT-4o รองรับการโต้ตอบหลายรูปแบบและแชร์หน้าจอแบบเรียลไทม์

เปิดฟีเจอร์ใหม่ ChatGPT: GPT-4o รองรับการโต้ตอบหลายรูปแบบและแชร์หน้าจอแบบเรียลไทม์

6/6/2569
ChatGPT

บอกตามตรงว่า OpenAI อัปเดต ChatGPT ครั้งนี้ใหญ่ไม่น้อย การเปิดให้ใช้โมเดล GPT-4o อย่างเต็มรูปแบบทำให้ผู้ใช้หลายคนตื่นเต้น ในฐานะคนที่ใช้ฟีเจอร์ใหม่เหล่านี้เป็นกลุ่มแรก ผมอยากพูดถึงฟีเจอร์ที่เปลี่ยนประสบการณ์การใช้งานจริงๆ โดยเฉพาะการโต้ตอบหลายรูปแบบ (Multimodal) และการแชร์หน้าจอ ซึ่งทำให้ ChatGPT จากผู้ช่วยแค่ข้อความธรรมดากลายเป็นเครื่องมืออเนกประสงค์ที่ครบเครื่อง

การโต้ตอบหลายรูปแบบของ ChatGPT และฟังก์ชันแปลภาษาทันที

ความสามารถหลายรูปแบบของ GPT-4o ไม่ใช่แค่การดูรูปภาพเท่านั้น จุด突破ที่สำคัญที่สุดคือสามารถประมวลผลเสียง ข้อความ และวิดีโอได้พร้อมกัน เมื่อคุณพูดกับมันโดยตรง มันสามารถรับรู้น้ำเสียงและอารมณ์ของคุณ และน้ำเสียงตอบกลับก็จะมีความเป็นมนุษย์มากขึ้น เช่น ถ้าคุณพูดว่า "ช่วยเขียนอีเมลให้หน่อย" ด้วยเสียงเหนื่อยๆ มันก็จะตอบกลับด้วยน้ำเสียงที่นุ่มนวลกว่า

อีกหนึ่งอัปเกรดที่ใช้งานได้จริงคือการแปลภาษาทันที แม้ว่า ChatGPT เวอร์ชันเก่าจะแปลได้ แต่ GPT-4o สามารถแปลแบบ real-time ได้ รองรับ 50 ภาษา สลับภาษาในระหว่างสนทนาได้โดยแทบไม่มีดีเลย์ ผมลองพูดผสมไทย-อังกฤษ มันตอบสนองเร็วมาก

การสื่อสารอัตโนมัติระหว่าง AI และประสบการณ์โต้ตอบเชิงลึก

สิ่งที่ทำให้ผมประหลาดใจที่สุดใน GPT-4o คือ AI สามารถสนทนากันเองได้ เช่น ให้มันเล่นเป็นสองบทบาทที่แตกต่างกัน กำหนดจุดยืนให้โต้แย้งกัน แล้วปล่อยให้ทั้งสองสนทนากันเองโดยแทบไม่ต้องแทรกแซง การโต้ตอบเชิงลึกแบบนี้มีประโยชน์มากสำหรับการระดมสมอง คุณสามารถให้ AI ตัวหนึ่งเสนอแผนแบบอนุรักษ์นิยม และอีกตัวเสนอแผนรุก แล้วมันก็จะวิเคราะห์ข้อดีข้อเสียให้คุณเอง

เทคนิคการใช้งานจริง: แชร์หน้าจอแก้ปัญหาโค้ด

ถ้าคุณเขียนโค้ดหรือทำงานกับภาพ การแชร์หน้าจอถือเป็นฟีเจอร์ที่เจ๋งที่สุด ก่อนหน้านี้เวลาเจอ bug ต้องคัดลอกโค้ดหรือจับภาพหน้าจอส่งให้ ChatGPT แต่ตอนนี้แค่แชร์หน้าจอก็พอ GPT-4o สามารถอ่านเนื้อหาบนหน้าจอของคุณแบบ real-time รวมถึง error ของ Python งานออกแบบ หรือแม้แต่ timeline ตัดต่อวิดีโอ คุณแค่ชี้จุดที่มีปัญหาบนหน้าจอแล้วถามด้วยเสียง มันก็จะบอกวิธีแก้ไขทีละขั้นตอนเหมือนติวเตอร์ส่วนตัว

จริงๆ แล้ว ChatGPT เวอร์ชัน macOS สามารถแก้ไขโค้ดใน Xcode หรือ VS Code ให้คุณได้โดยตรง รองรับผู้ใช้ Plus และ Pro ผมลองเขียน JavaScript ที่ซับซ้อน มันระบุตำแหน่งและแก้ไขในไฟล์โปรเจกต์ของผมได้โดยตรง ช่วยประหยัดเวลาในการคัดลอกวาง

ติวเตอร์ส่วนตัวและฟังก์ชันเพื่อสังคมราคาจับต้องได้

ผู้ใช้หลายคนใช้ GPT-4o เป็นติวเตอร์ตัวต่อตัว คุณแชร์หน้าจอโจทย์คณิตหรือฟิสิกส์ มันจะอธิบายวิธีทำทีละขั้นตอน หรืออธิบายด้วยวิธีต่างๆ จนกว่าคุณจะเข้าใจ สำหรับผู้ใช้ที่มีปัญหาทางสายตา GPT-4o สามารถอธิบายภาพจากกล้องแบบ real-time เช่น "ข้างหน้าสามเมตรมีเก้าอี้ อยู่ทางซ้ายมือของคุณ" ซึ่งเป็นคำสั่งที่แม่นยำ ความใส่ใจทางเทคโนโลยีแบบนี้ทำให้รู้สึกว่า AI ไม่ใช่แค่เครื่องมือเพิ่มผลผลิต แต่ยังอบอุ่นใจด้วย

แน่นอนว่าฟีเจอร์เหล่านี้ผู้ใช้ฟรีก็สามารถลองใช้ได้ แต่มีจำกัดจำนวนครั้ง ถ้าเกินจะถูกเปลี่ยนกลับไปใช้ GPT-3.5 ถ้าคุณใช้งานบ่อย อัปเกรดเป็น ChatGPT Plus จะราบรื่นกว่า เพราะส่งข้อความได้ 80 ข้อความทุก 3 ชั่วโมง และยังใช้โมเดล reasoning ล่าสุดสำหรับการวิเคราะห์ที่ซับซ้อนได้

หน้าแรกร้านค้าคำสั่งซื้อ