Anthropic เปิดตัว Claude Opus 4.8 อย่างเป็นทางการเมื่อไม่นานมานี้ ห่างจากการเปิดตัว Opus 4.7 เพียง 41 วัน โมเดลใหม่นี้ทำคะแนนสูงกว่า GPT-5.5 ถึง 10 คะแนนในเกณฑ์มาตรฐาน SWE-Bench Pro และครองอันดับ 1 ในดัชนี Artificial Analysis Intelligence ด้วยคะแนน 61.4 นำหน้า GPT-5.5 ที่ได้ 60.2 คะแนน การอัปเกรดครั้งนี้ถือเป็นการเปลี่ยนแปลงสถาปัตยกรรมที่แท้จริง ไม่ใช่แค่การปรับปรุงโมเดลเล็กน้อย
จุดเด่นของ Opus 4.8 คือการเพิ่มเครื่องมือ Dynamic Workflows ที่ช่วยให้ Claude สามารถวางแผนงานขนาดใหญ่และกระจายงานไปยัง subagents หลายสิบถึงหลายร้อยตัวแบบขนาน ก่อนตรวจสอบผลลัพธ์และส่งคืนผลลัพธ์ที่สมบูรณ์ นอกจากนี้ โมเดลยังมี ความซื่อสัตย์เพิ่มขึ้น 4 เท่า หมายถึงสามารถบอกความไม่แน่นอนของตัวเองได้แม่นยำยิ่งขึ้น ในการทดสอบงานที่ต้องใช้บริบทระยะยาว Opus 4.8 มีประสิทธิภาพเหนือกว่า GPT-5.5 และ Gemini 3.1 Pro อย่างชัดเจน

