Claude 3.5 อัปเกรดครั้งใหญ่: ความสามารถควบคุมคอมพิวเตอร์และการเขียนโค้ดก้าวกระโดด

Anthropic เปิดตัวอัปเกรดครั้งสำคัญให้กับ Claude 3.5 Sonnet ไม่ใช่แค่การปรับแต่งเล็กน้อย แต่ทำให้ AI สามารถควบคุมคอมพิวเตอร์ได้โดยตรง พูดง่ายๆ คือตอนนี้ Claude มองเห็นหน้าจอคุณ ขยับเมาส์ และพิมพ์ข้อความได้แล้ว ในขณะเดียวกัน Claude 3.5 Haiku รุ่นใหม่ก็เปิดตัวด้วยความเร็วสูง สร้างผลงานโดดเด่นในการทดสอบมาตรฐานหลายรายการ การอัปเกรดครั้งนี้เปิดจินตนาการใหม่สำหรับทั้งนักพัฒนาและผู้ใช้ทั่วไป

ฟีเจอร์ใหม่ของ Claude 3.5 Sonnet: ใช้คอมพิวเตอร์เหมือนมนุษย์

จุดเด่นหลักของการอัปเกรดครั้งนี้คือความสามารถในการควบคุมคอมพิวเตอร์ที่เพิ่มเข้ามาใน Claude 3.5 Sonnet Anthropic สร้าง API โดยเฉพาะ เพื่อให้ Claude รับรู้ข้อมูลพิกเซลบนหน้าจอและโต้ตอบกับมันได้เหมือนมนุษย์ นักพัฒนาสามารถผสาน API นี้เพื่อให้ Claude ดำเนินงานหลายขั้นตอน เช่น "เปิดเบราว์เซอร์ เข้าสู่ระบบอีเมล ส่งอีเมล" ในการทดสอบมาตรฐาน OSWorld Claude 3.5 Sonnet ได้คะแนน 14.9% โดยใช้เพียงภาพหน้าจอ ซึ่งสูงกว่าอันดับสองอย่างมาก

แน่นอนว่าฟีเจอร์นี้ยังอยู่ในขั้นทดสอบ Claude ยังมีข้อจำกัดในการทำงานที่ละเอียด เช่น การเลื่อน หรือการลากวาง อาจทำให้หยุดชะงักระหว่างการบันทึกหน้าจอนาน อย่างไรก็ตาม บริษัทหลายแห่งรวมถึง Canva และ DoorDash เริ่มทดสอบฟีเจอร์นี้ของ Claude เพื่อทำงานซ้ำๆ ในเวิร์กโฟลว์โดยอัตโนมัติ เช่น Replit ใช้มันเพื่อสร้าง Agent ที่ตรวจสอบแอปพลิเคชันได้

ประสิทธิภาพการเขียนโค้ดก้าวกระโดด: เป็นผู้นำในอุตสาหกรรม

นอกจากควบคุมคอมพิวเตอร์แล้ว ความสามารถในการเขียนโค้ดของ Claude 3.5 Sonnet ก็พัฒนาขึ้นอย่างก้าวกระโดดเช่นกัน คะแนนในการทดสอบ SWE-bench Verified เพิ่มขึ้นจาก 33.4% เป็น 49.0% ซึ่งสูงกว่าโมเดลสาธารณะหลายตัว รวมถึงโมเดล推理เฉพาะทางด้วย การทดสอบของ GitLab แสดงให้เห็นว่า Claude เวอร์ชันใหม่ให้ความสามารถในการ推理ที่แข็งแกร่งขึ้นสำหรับงาน DevSecOps โดยไม่เพิ่มความหน่วง

หมายความว่านักพัฒนาสามารถมอบหมายงานพัฒนาซอฟต์แวร์ที่ซับซ้อนและมีหลายขั้นตอนให้กับมันได้อย่างมั่นใจมากขึ้น ในการทดสอบ HumanEval ที่ประเมินความสามารถเขียนโค้ด Claude 3.5 Sonnet ได้คะแนน 93.7% ความสามารถในการจัดการปัญหาซอฟต์แวร์จริงเพิ่มขึ้นอย่างมาก สำหรับผู้ใช้ที่ต้องทำงานร่วมกับ AI เขียนโค้ดบ่อยๆ การอัปเกรด Claude ครั้งนี้ช่วยเพิ่มประสิทธิภาพอย่างแท้จริง

Claude 3.5 Haiku: สมดุลที่ลงตัวระหว่างความเร็วและความฉลาด

พร้อมกับ Claude 3.5 Sonnet ยังมีโมเดลความเร็วสูงรุ่นใหม่อย่าง Claude 3.5 Haiku จุดแข็งที่สุดคือต้นทุนและความเร็วที่เท่ากับ Haiku รุ่นก่อน แต่ความฉลาดเพิ่มขึ้นอย่างมาก จนเทียบเท่า Claude 3 Opus รุ่นเรือธงรุ่นก่อนหน้า ในงานเขียนโค้ด Claude 3.5 Haiku ทำคะแนน 40.6% ใน SWE-bench Verified ซึ่งเหนือกว่า GPT-4 และโมเดลอื่นๆ อีกมากมาย

ในแง่การวางตำแหน่งผลิตภัณฑ์ Claude 3.5 Haiku เหมาะมากสำหรับแอปพลิเคชันเรียลไทม์ที่ไวต่อความหน่วง เช่น ผลิตภัณฑ์ที่ใช้งานโดยตรงกับผู้ใช้ งานของ Agent ย่อย หรือบริการที่ต้องสร้างประสบการณ์เฉพาะบุคคลจากข้อมูลจำนวนมาก หากคุณต้องการความเร็วสูงโดยไม่ลดทอนความฉลาดมากนัก โมเดลใหม่นี้ถือเป็นตัวเลือกที่คุ้มค่าที่สุด

ฟีเจอร์ใหม่ของ Claude 3.5 Sonnet: ใช้คอมพิวเตอร์เหมือนมนุษย์

ประสิทธิภาพการเขียนโค้ดก้าวกระโดด: เป็นผู้นำในอุตสาหกรรม

Claude 3.5 Haiku: สมดุลที่ลงตัวระหว่างความเร็วและความฉลาด

ค้นหาบทความ

บทความยอดนิยม

ChatGPT Prompt ยอดนิยม 10 ข้อที่เพิ่มประสิทธิภาพการทำงานได้จริง 10 เท่า

Spotify รหัสข้อผิดพลาดในการเล่นเพลง รวมวิธีแก้ไขเบื้องต้น