Trải nghiệm tính năng mới của Claude API: Công tắc xuất dài, Đánh giá Workbench và Bảng điều khiển chi phí

Nếu bạn đang sử dụng Claude API để tóm tắt, viết code hoặc tạo nội dung dài gần đây, điểm thay đổi dễ nhận thấy nhất chính là khả năng "xuất văn bản dài hơn", đồng thời bảng điều khiển dành cho nhà phát triển (developer console) cũng được cải thiện đáng kể. Bài viết này sẽ phân tích từng tính năng mới của Claude API: cách kích hoạt chế độ xuất dài, sử dụng Workbench để đánh giá hiệu quả của prompt và làm thế nào để theo dõi chi phí một cách rõ ràng trên bảng điều khiển.

Xuất dài trên Claude API: Sonnet 3.5 tăng từ 4096 lên 8192 token

Claude API đã nâng giới hạn token đầu ra tối đa cho Claude Sonnet 3.5 lên 8192, nhưng bạn cần bật tính năng này một cách rõ ràng. Khi gọi Claude API, hãy thêm tiêu đề anthropic-beta vào request header để kích hoạt cửa sổ xuất dài hơn, phù hợp để tạo một lần các báo cáo hoàn chỉnh, file code dài hoặc bản tóm tắt nhiều phần.

Cách viết cụ thể rất rõ ràng: Thêm tiêu đề request anthropic-beta: max-tokens-3-5-sonnet-2024-07-15. Nếu bạn gặp lỗi "đầu ra bị cắt ngắn" trong Claude API, trước tiên hãy kiểm tra xem đã bật công tắc này chưa, và tham số max_tokens của bạn có được đặt đủ lớn hay không.

Workbench tiện dụng hơn: Trình tạo Prompt và Chế độ đánh giá

Trong Workbench của Claude Console, trải nghiệm gỡ lỗi cho Claude API đã được bổ sung hai công cụ then chốt. Đầu tiên là "Trình tạo Prompt" (Prompt Generator): bạn chỉ cần mô tả mục tiêu công việc (ví dụ: "phân loại các yêu cầu hỗ trợ khách hàng đến"), nó sẽ đưa ra một bản nháp prompt có cấu trúc hoàn chỉnh, có thể sao chép trực tiếp vào Claude API.

Thứ hai là "Chế độ đánh giá" (Evaluation Mode): chạy song song hai hoặc nhiều bộ prompt trên cùng một batch dữ liệu đầu vào, kết quả đầu ra sẽ được đặt cạnh nhau để so sánh, và bạn còn có thể chấm điểm hiệu suất theo thang 5 điểm. Đối với các kịch bản Claude API cần đầu ra ổn định (phân luồng hỗ trợ khách hàng, trích xuất thông tin, chỉnh sửa tuân thủ), bước này có thể giảm đáng kể việc điều chỉnh tham số dựa trên cảm tính.

Bảng điều khiển sử dụng và chi phí: Tính toán rõ ràng chi phí Claude API

Sau khi bảng điều khiển dành cho nhà phát triển bổ sung các thẻ "Usage" (Lượng dùng) và "Billing" (Chi phí), hóa đơn cho Claude API không còn chỉ dựa vào cảm tính. Bạn có thể theo dõi mức tiêu thụ theo số tiền (USD), số lượng token và theo từng API Key, từ đó nhanh chóng xác định "chính xác Key nào đang làm tăng chi phí".

Khuyến nghị nên tách các môi trường khác nhau thành các Key khác nhau (ví dụ: phát triển/thử nghiệm/sản xuất), sau đó kết hợp với bảng điều khiển để xem lại các thời điểm sử dụng cao điểm. Bằng cách này, nếu Claude API xuất hiện các lệnh gọi bất thường hoặc yêu cầu lặp vòng, bạn có thể phát hiện trước khi chi phí tăng lên quá lớn.

Tài liệu và tài nguyên học tập hoàn thiện hơn: Ghi chú phát hành, Khóa học và Cookbook

Tài liệu Claude API đã bổ sung phần ghi chú phát hành (Release Notes) có hệ thống hơn, bao gồm các điểm cập nhật cho API, Claude Console và Ứng dụng Claude, phù hợp để các nhóm ghi lại các thay đổi phiên bản. Đồng thời, bên chính thức cũng đã ra mắt các khóa học về cơ bản Claude API và cách sử dụng công cụ, giúp người mới bắt đầu nhanh chóng bổ sung các kỹ năng như gọi API, xuất JSON có cấu trúc.

Nếu bạn đang thực hiện tác vụ RAG (Retrieval-Augmented Generation), chú thích trích dẫn hoặc phân loại, bạn có thể tra cứu trực tiếp các hướng dẫn liên quan trong Claude Cookbook, tiết kiệm thời gian lặp lại các lỗi phổ biến. Nhìn chung, đợt cập nhật Claude API lần này không tập trung vào "tính năng phô trương", mà là củng cố ba khía cạnh then chốt: xuất dài, đánh giá và quản lý chi phí.

Xuất dài trên Claude API: Sonnet 3.5 tăng từ 4096 lên 8192 token

Workbench tiện dụng hơn: Trình tạo Prompt và Chế độ đánh giá

Bảng điều khiển sử dụng và chi phí: Tính toán rõ ràng chi phí Claude API

Tài liệu và tài nguyên học tập hoàn thiện hơn: Ghi chú phát hành, Khóa học và Cookbook

Tìm kiếm bài viết

Bài viết phổ biến

Các Prompt ChatGPT Tốt Nhất: Cách Dùng Để Tăng Hiệu Suất Gấp 10 Lần

Tổng hợp mã lỗi phát nhạc Spotify và cách khắc phục nhanh chóng