Nếu bạn đang sử dụng Claude API để tóm tắt, viết code hoặc tạo nội dung dài gần đây, điểm thay đổi dễ nhận thấy nhất chính là khả năng "xuất văn bản dài hơn", đồng thời bảng điều khiển dành cho nhà phát triển (developer console) cũng được cải thiện đáng kể. Bài viết này sẽ phân tích từng tính năng mới của Claude API: cách kích hoạt chế độ xuất dài, sử dụng Workbench để đánh giá hiệu quả của prompt và làm thế nào để theo dõi chi phí một cách rõ ràng trên bảng điều khiển.
Xuất dài trên Claude API: Sonnet 3.5 tăng từ 4096 lên 8192 token
Claude API đã nâng giới hạn token đầu ra tối đa cho Claude Sonnet 3.5 lên 8192, nhưng bạn cần bật tính năng này một cách rõ ràng. Khi gọi Claude API, hãy thêm tiêu đề anthropic-beta vào request header để kích hoạt cửa sổ xuất dài hơn, phù hợp để tạo một lần các báo cáo hoàn chỉnh, file code dài hoặc bản tóm tắt nhiều phần.
Cách viết cụ thể rất rõ ràng: Thêm tiêu đề request anthropic-beta: max-tokens-3-5-sonnet-2024-07-15. Nếu bạn gặp lỗi "đầu ra bị cắt ngắn" trong Claude API, trước tiên hãy kiểm tra xem đã bật công tắc này chưa, và tham số max_tokens của bạn có được đặt đủ lớn hay không.
Workbench tiện dụng hơn: Trình tạo Prompt và Chế độ đánh giá
Trong Workbench của Claude Console, trải nghiệm gỡ lỗi cho Claude API đã được bổ sung hai công cụ then chốt. Đầu tiên là "Trình tạo Prompt" (Prompt Generator): bạn chỉ cần mô tả mục tiêu công việc (ví dụ: "phân loại các yêu cầu hỗ trợ khách hàng đến"), nó sẽ đưa ra một bản nháp prompt có cấu trúc hoàn chỉnh, có thể sao chép trực tiếp vào Claude API.
Thứ hai là "Chế độ đánh giá" (Evaluation Mode): chạy song song hai hoặc nhiều bộ prompt trên cùng một batch dữ liệu đầu vào, kết quả đầu ra sẽ được đặt cạnh nhau để so sánh, và bạn còn có thể chấm điểm hiệu suất theo thang 5 điểm. Đối với các kịch bản Claude API cần đầu ra ổn định (phân luồng hỗ trợ khách hàng, trích xuất thông tin, chỉnh sửa tuân thủ), bước này có thể giảm đáng kể việc điều chỉnh tham số dựa trên cảm tính.


