Claude Sonnet 4.6 mở rộng ngữ cảnh 1 triệu token và đẩy mạnh computer use
Điểm nổi bật
- 1 triệu token: Claude Sonnet 4.6 bổ sung cửa sổ ngữ cảnh 1M token ở chế độ beta, đủ chứa cả codebase lớn, hợp đồng dài hoặc hàng chục paper trong một lượt xử lý.
- Giữ nguyên giá: Anthropic cho biết giá API vẫn như Sonnet 4.5, từ 3 USD / 15 USD cho mỗi triệu token đầu vào và đầu ra.
- Ưa chuộng hơn bản cũ: Trong thử nghiệm sớm, người dùng chọn Sonnet 4.6 nhiều hơn Sonnet 4.5 khoảng 70%, và còn ưu tiên hơn Opus 4.5 tới 59% trong một số workflow lập trình.
- Tăng tốc computer use: Anthropic nói khách hàng sớm đã thấy năng lực gần mức con người ở các tác vụ như điền form nhiều bước, thao tác bảng tính phức tạp và phối hợp nhiều tab trình duyệt.
- Tăng hiệu quả doanh nghiệp: Box ghi nhận Sonnet 4.6 cao hơn 15 điểm phần trăm so với Sonnet 4.5 ở bài test hỏi đáp suy luận sâu trên tài liệu doanh nghiệp.
Biểu đồ
Tóm tắt
Anthropic vừa nâng Claude Sonnet 4.6 thành model mặc định trên Claude.ai và Claude Cowork, đồng thời giữ nguyên khung giá của Sonnet 4.5. Điểm nâng cấp đáng chú ý không nằm ở một benchmark đơn lẻ mà ở bộ kỹ năng tổng thể: coding, reasoning dài hơi, lập kế hoạch cho agent, đọc hiểu tài liệu doanh nghiệp và đặc biệt là computer use.
Với cửa sổ ngữ cảnh 1 triệu token ở chế độ beta, Sonnet 4.6 được định vị như lựa chọn “hiệu năng gần Opus nhưng chi phí thấp hơn”, phù hợp cho các tác vụ triển khai thật trong doanh nghiệp. Nếu tuyên bố hiệu năng thực tế của Anthropic giữ được khi đi vào production, đây là bước đi quan trọng trong cuộc đua chuyển AI từ chatbot sang tầng vận hành công việc số.
Chi tiết
Claude Sonnet 4.6 là một cập nhật đáng chú ý vì Anthropic đang cố gắng tái định nghĩa phân khúc model tầm trung. Thay vì buộc khách hàng chọn giữa model rẻ nhưng hạn chế và model đầu bảng nhưng đắt đỏ, Anthropic đưa ra thông điệp khá rõ: Sonnet 4.6 tiến gần năng lực của dòng Opus trong nhiều tác vụ thực tế, nhưng vẫn giữ mức giá quen thuộc, bắt đầu từ 3 USD cho mỗi triệu token đầu vào và 15 USD cho mỗi triệu token đầu ra. Đây là tín hiệu chiến lược quan trọng, vì thị trường AI năm 2026 đang cạnh tranh không chỉ bằng benchmark mà bằng tổng chi phí sở hữu cho doanh nghiệp.
Nâng cấp đầu tiên có tác động trực tiếp tới sản phẩm là cửa sổ ngữ cảnh 1 triệu token ở chế độ beta. Với mức ngữ cảnh này, doanh nghiệp có thể nạp cả codebase lớn, hợp đồng dài, tài liệu tuân thủ, hoặc nhiều báo cáo nghiên cứu trong một lần gọi model. Nhưng điểm đáng chú ý hơn là Anthropic không chỉ nói về sức chứa, mà nhấn vào khả năng suy luận xuyên suốt trên khối ngữ cảnh lớn. Điều đó rất quan trọng cho các workflow dài hơi như rà soát mã nguồn, phân tích tài liệu pháp lý, điều phối tác vụ nhiều bước hoặc agent vận hành theo phiên kéo dài.
Mảng thứ hai là computer use, nơi Anthropic đang cố khóa vị thế tiên phong. Công ty nhắc lại rằng họ là bên đầu tiên đưa ra mô hình dùng máy tính đa dụng từ cuối năm 2024, và Sonnet 4.6 là bước tiến tiếp theo. Theo mô tả của hãng, model đã tiến gần mức sử dụng máy tính giống con người hơn trong các việc như điều hướng bảng tính phức tạp, điền biểu mẫu nhiều bước và phối hợp nhiều tab trình duyệt. Nếu năng lực này đủ ổn định trong môi trường thật, tác động sẽ vượt ra ngoài chatbot hoặc copilot thông thường, vì AI lúc đó có thể thao tác trực tiếp trên phần mềm cũ, nơi không có API tốt hoặc không dễ tích hợp tự động hóa truyền thống.
Anthropic cũng đưa ra vài chỉ dấu thương mại đáng lưu ý. Trong thử nghiệm sớm với Claude Code, người dùng chọn Sonnet 4.6 thay vì Sonnet 4.5 khoảng 70% số lần, và thậm chí ưu tiên hơn Opus 4.5 tới 59% trong một số phiên làm việc. Lý do được nhắc đến là model đỡ “overengineering”, ít lười xử lý hơn, đọc ngữ cảnh tốt hơn và bám chỉ dẫn ổn định hơn. Đây là nhóm tiêu chí rất thực dụng, phản ánh trải nghiệm triển khai hơn là màn trình diễn benchmark. Trong môi trường doanh nghiệp, sự ổn định và khả năng hoàn thành chuỗi tác vụ nhiều bước thường giá trị hơn việc thắng vài điểm trên bảng xếp hạng học thuật.
Một chỉ dấu khác là phản hồi từ khách hàng doanh nghiệp. Anthropic dẫn Box, đơn vị ghi nhận Sonnet 4.6 tăng 15 điểm phần trăm so với Sonnet 4.5 ở bài test hỏi đáp suy luận sâu trên tài liệu doanh nghiệp. Công ty cũng nêu thêm các trường hợp dùng trong frontend code, phân tích tài chính, xử lý tài liệu bảo hiểm và iOS code. Dù đây đều là tuyên bố từ hệ sinh thái đối tác, chúng cho thấy Anthropic đang cố xây dựng thông điệp rằng Sonnet 4.6 không chỉ mạnh với lập trình viên mà còn phù hợp cho nghiệp vụ tài liệu, vận hành và tri thức doanh nghiệp.
Về rủi ro, điểm yếu lớn nhất vẫn là computer use đi kèm prompt injection và thao tác sai trên giao diện thật. Anthropic thừa nhận chính điều này và nói đã cải thiện đáng kể khả năng chống prompt injection so với Sonnet 4.5. Tuy vậy, với doanh nghiệp, thông điệp đúng có lẽ không phải là “AI đã sẵn sàng tự làm mọi thứ”, mà là “AI bắt đầu đủ tốt để tự động hóa một phần các quy trình số có giám sát”. Nếu áp dụng đúng, Sonnet 4.6 có thể giúp giảm chi phí ở các luồng công việc nhiều thao tác, nhiều tài liệu và cần phối hợp công cụ. Nếu áp dụng quá nhanh, rủi ro sai lệch, bảo mật và kiểm soát vẫn còn rất thực.
Tóm lại, Sonnet 4.6 là một bản nâng cấp sản phẩm có ý nghĩa vì nó kết hợp ba yếu tố trong cùng một gói: ngữ cảnh rất dài, computer use tốt hơn, và mức giá không tăng. Trong cuộc đua AI hiện nay, đây là dạng cải tiến có khả năng thúc đẩy dùng thật trong doanh nghiệp nhanh hơn các tuyên bố mô hình “thông minh hơn” nhưng chi phí cao hoặc khó vận hành.