อัปเดต Claude API นี้ได้รับการออกแบบให้เหมาะกับการใช้งานประจำวันของนักพัฒนา โดยมีจุดมุ่งหมายหลักเพื่อทำให้การสอบถามโมเดล การสร้างผลลัพธ์ยาว และการจัดการบิลค่าใช้จ่ายควบคุมได้ง่ายขึ้น บทความนี้จะแยกอธิบาย Models API, การขยายขีดจำกัดผลลัพธ์ และแดชบอร์ดการใช้งานและค่าใช้จ่ายในคอนโซลอย่างชัดเจน เพื่อให้คุณนำไปปรับใช้ในกระบวนการเรียกใช้ที่มีอยู่ได้โดยตรง
Models API: ตรวจสอบโมเดลที่ใช้ได้ก่อนเรียกใช้งาน
ใน Claude API ค่าของ Models API นั้นตรงไปตรงมา: คุณสามารถสอบถามโมเดลที่ใช้ได้ในปัจจุบัน และตรวจสอบว่า รหัสโมเดล (Model ID) ที่คุณเตรียมใช้งานนั้นถูกต้องหรือไม่ สำหรับการปรับใช้ในหลายสภาพแวดล้อม นี่ช่วยลดปัญหาเช่น "โมเดลไม่พร้อมใช้งาน" หรือ "รหัสโมเดลผิดพลาด" ที่อาจเกิดขึ้นระหว่างการทำงานจริง โดยการย้ายขั้นตอนการตรวจสอบไปไว้ในกระบวนการเผยแพร่ตั้งแต่แรก
หากคุณมีคีย์ API หลายชุดหรือโครงการหลายโครงการ ขอแนะนำให้ดึงรายการโมเดลผ่าน Models API พร้อมทำการตรวจสอบบัญชีขาว (whitelist validation) ในขั้นตอนเริ่มต้นระบบ ด้วยวิธีนี้ คำขอ Claude API ของคุณจะสามารถยืนยันได้ว่าโมเดลพร้อมใช้งานก่อนเข้าสู่ลอจิกหลัก และทำให้การติดตามบันทึก (log) เป็นไปได้ง่ายขึ้น
การขยายผลลัพธ์: สร้างเนื้อหายาวครั้งเดียวจบ
Claude API ให้ความสามารถในการขยายผลลัพธ์สำหรับ Claude Sonnet 3.5 โดยเพิ่มขีดจำกัดโทเค็นผลลัพธ์สูงสุดจาก 4096 เป็น 8192 วิธีการเปิดใช้งานคือการเพิ่มส่วนหัวคำขอ (request header) ที่กำหนด (anthropic-beta) ซึ่งเหมาะกับสถานการณ์เช่นการสร้างรายงานยาว การสร้างโค้ดยาว หรือการสรุปบันทึกการประชุมจำนวนมาก ซึ่งการถูกตัดกลางคันมักสร้างปัญหา
ในทางปฏิบัติ ขอแนะนำให้ปรับเปลี่ยนสองจุดควบคู่กัน: ประการแรก จัดการให้การแสดงสถานะ "กำลังสร้าง" (generating) ด้านหน้าสุด (frontend) เป็นการแสดงผลแบบสตรีมที่ต่อเนื่องได้ ประการที่สอง ผ่อนคลายนโยบายการหมดเวลา (timeout) และการลองใหม่ (retry) ของ Claude API เล็กน้อย เพื่อป้องกันไม่ให้ผลลัพธ์ยาวถูกขัดจังหวะโดยปัญหาการกระตุกของเครือข่าย


