Bản cập nhật Claude API lần này tập trung vào "trải nghiệm hàng ngày thân thiện cho nhà phát triển", cốt lõi là giúp việc truy vấn model, xuất văn bản dài và quản lý hóa đơn trở nên kiểm soát được hơn. Bài viết này sẽ phân tích rõ Models API, giới hạn đầu ra mở rộng và bảng điều khiển theo dõi lượng dùng/chi phí, giúp bạn dễ dàng áp dụng trực tiếp vào quy trình gọi API hiện có.
Models API: Truy vấn model có sẵn trước khi gọi
Trong Claude API, giá trị của Models API rất trực tiếp: Bạn có thể truy vấn các model hiện có và xác minh xem ID model bạn định sử dụng có chính xác không. Đối với triển khai đa môi trường, điều này giúp giảm các sự cố như "model không khả dụng" hoặc "sai ID" trong môi trường production, bằng cách đẩy việc kiểm tra lên trước trong quy trình phát hành.
Nếu bạn có nhiều API Key hoặc nhiều dự án, nên lấy danh sách một lần qua Models API trong giai đoạn khởi tạo và thực hiện kiểm tra danh sách cho phép. Bằng cách này, yêu cầu Claude API của bạn có thể xác định model khả dụng trước khi vào logic chính, đồng thời giúp việc định vị nhật ký dễ dàng hơn.
Mở rộng đầu ra: Hoàn thành nội dung dài một lần
Claude API cung cấp khả năng xuất mở rộng cho Claude Sonnet 3.5, nâng token đầu ra tối đa từ 4096 lên 8192. Cách kích hoạt là thêm một tiêu đề yêu cầu cụ thể (anthropic-beta), phù hợp cho các tình huống như báo cáo dài, tạo mã dài, tổng hợp biên bản cuộc họp hàng loạt - những trường hợp mà việc bị cắt ngang ở giữa rất phiền phức.
Trên thực tế, nên điều chỉnh hai điểm đồng thời: Một là tạo thông báo "đang tạo" ở front-end thành luồng hiển thị liên tục; Hai là nới lỏng chính sách timeout và thử lại của Claude API một chút, để tránh đầu ra dài bị gián đoạn do mạng không ổn định.


