Anthropic เปิดตัวอัปเกรดครั้งสำคัญให้กับ Claude 3.5 Sonnet ไม่ใช่แค่การปรับแต่งเล็กน้อย แต่ทำให้ AI สามารถควบคุมคอมพิวเตอร์ได้โดยตรง พูดง่ายๆ คือตอนนี้ Claude มองเห็นหน้าจอคุณ ขยับเมาส์ และพิมพ์ข้อความได้แล้ว ในขณะเดียวกัน Claude 3.5 Haiku รุ่นใหม่ก็เปิดตัวด้วยความเร็วสูง สร้างผลงานโดดเด่นในการทดสอบมาตรฐานหลายรายการ การอัปเกรดครั้งนี้เปิดจินตนาการใหม่สำหรับทั้งนักพัฒนาและผู้ใช้ทั่วไป
ฟีเจอร์ใหม่ของ Claude 3.5 Sonnet: ใช้คอมพิวเตอร์เหมือนมนุษย์
จุดเด่นหลักของการอัปเกรดครั้งนี้คือความสามารถในการควบคุมคอมพิวเตอร์ที่เพิ่มเข้ามาใน Claude 3.5 Sonnet Anthropic สร้าง API โดยเฉพาะ เพื่อให้ Claude รับรู้ข้อมูลพิกเซลบนหน้าจอและโต้ตอบกับมันได้เหมือนมนุษย์ นักพัฒนาสามารถผสาน API นี้เพื่อให้ Claude ดำเนินงานหลายขั้นตอน เช่น "เปิดเบราว์เซอร์ เข้าสู่ระบบอีเมล ส่งอีเมล" ในการทดสอบมาตรฐาน OSWorld Claude 3.5 Sonnet ได้คะแนน 14.9% โดยใช้เพียงภาพหน้าจอ ซึ่งสูงกว่าอันดับสองอย่างมาก
แน่นอนว่าฟีเจอร์นี้ยังอยู่ในขั้นทดสอบ Claude ยังมีข้อจำกัดในการทำงานที่ละเอียด เช่น การเลื่อน หรือการลากวาง อาจทำให้หยุดชะงักระหว่างการบันทึกหน้าจอนาน อย่างไรก็ตาม บริษัทหลายแห่งรวมถึง Canva และ DoorDash เริ่มทดสอบฟีเจอร์นี้ของ Claude เพื่อทำงานซ้ำๆ ในเวิร์กโฟลว์โดยอัตโนมัติ เช่น Replit ใช้มันเพื่อสร้าง Agent ที่ตรวจสอบแอปพลิเคชันได้
ประสิทธิภาพการเขียนโค้ดก้าวกระโดด: เป็นผู้นำในอุตสาหกรรม
นอกจากควบคุมคอมพิวเตอร์แล้ว ความสามารถในการเขียนโค้ดของ Claude 3.5 Sonnet ก็พัฒนาขึ้นอย่างก้าวกระโดดเช่นกัน คะแนนในการทดสอบ SWE-bench Verified เพิ่มขึ้นจาก 33.4% เป็น 49.0% ซึ่งสูงกว่าโมเดลสาธารณะหลายตัว รวมถึงโมเดล推理เฉพาะทางด้วย การทดสอบของ GitLab แสดงให้เห็นว่า Claude เวอร์ชันใหม่ให้ความสามารถในการ推理ที่แข็งแกร่งขึ้นสำหรับงาน DevSecOps โดยไม่เพิ่มความหน่วง

