DeepSeek V4 giảm khoảng cách với mô hình biên và đẩy áp lực lên mặt bằng giá AI

Điểm nổi bật
- 1,6 nghìn tỷ tham số: DeepSeek V4-Pro được mô tả có 1,6 nghìn tỷ tham số và cửa sổ ngữ cảnh 1 triệu token.
- Giá đầu ra 3,48 USD/triệu token: thấp hơn đáng kể so với mức khoảng 25-30 USD/triệu token mà Fortune dẫn lại từ Anthropic và OpenAI.
- Bản Flash chỉ 0,28 USD/triệu token: tạo sức ép trực diện lên phân khúc suy luận chi phí thấp.
- Huawei có “full support”: DeepSeek cho biết mô hình mới hỗ trợ chặt với hệ chip Ascend của Huawei.
- Khoảng cách còn 3-6 tháng: chính báo cáo kỹ thuật của DeepSeek thừa nhận vẫn hơi kém GPT-5.4 và Gemini 3.1 Pro.
Biểu đồ
Tóm tắt
DeepSeek tiếp tục chơi đúng “lá bài” từng giúp hãng gây chấn động trước đó: đưa hiệu năng lên gần nhóm dẫn đầu nhưng giữ giá cực thấp. Với V4-Pro và V4-Flash, câu chuyện không còn chỉ là một bản cập nhật sản phẩm, mà là thông điệp rằng khoảng cách giữa mô hình mở và mô hình đóng đang thu hẹp nhanh hơn dự đoán của thị trường.
Điểm chiến lược nằm ở chỗ DeepSeek kết hợp ba yếu tố cùng lúc: hiệu năng reasoning và coding đủ sát nhóm frontier, định giá rất thấp, và thêm liên kết với hệ chip Huawei. Nếu thông điệp này đứng vững sau giai đoạn preview, nó có thể buộc các nhà cung cấp lớn phải xem lại cả chiến lược giá lẫn cách bảo vệ biên lợi nhuận.
Chi tiết
Theo Fortune, DeepSeek đã phát hành hai phiên bản mới là V4-Pro và V4-Flash trong ngày 24/4, đánh dấu bản nâng cấp lớn tiếp theo sau chuỗi mô hình từng làm rung chuyển thị trường AI toàn cầu. Trọng tâm của lần ra mắt này là sự kết hợp giữa hiệu năng ở nhóm cao và cấu trúc giá rất thấp. V4-Pro được mô tả có 1,6 nghìn tỷ tham số, hỗ trợ ngữ cảnh lên tới 1 triệu token, trong khi bản Flash được đặt làm biến thể nhẹ hơn và rẻ hơn cho các tác vụ triển khai quy mô lớn.
Điểm đáng chú ý nhất là mức giá. Fortune dẫn lại việc V4-Pro có giá 3,48 USD cho một triệu token đầu ra, còn V4-Flash chỉ 0,28 USD. So với mặt bằng cao hơn nhiều từ các mô hình đóng của Mỹ, đây là tín hiệu rất mạnh cho thị trường doanh nghiệp: bài toán AI không còn chỉ xoay quanh “mô hình nào mạnh nhất”, mà chuyển dần sang “mức hiệu năng nào là đủ tốt với chi phí thấp nhất”. Với các tổ chức đang muốn triển khai trợ lý nội bộ, tự động hóa quy trình, phân tích tài liệu dài hay coding agent, chênh lệch giá như vậy có thể thay đổi quyết định mua hạ tầng và API.
Về năng lực, DeepSeek cho rằng V4 đã tiến sát các mô hình hàng đầu ở coding và reasoning. Tuy nhiên, điều quan trọng là chính báo cáo kỹ thuật của họ cũng thừa nhận mô hình vẫn kém GPT-5.4 và Gemini 3.1 Pro khoảng 3 đến 6 tháng về quỹ đạo phát triển. Chi tiết này cho thấy bức tranh thực tế hơn: DeepSeek chưa vượt nhóm đầu, nhưng đang tiến đủ gần để làm lung lay giả định rằng frontier AI phải đi kèm giá rất cao.
Lớp ý nghĩa thứ hai nằm ở chuỗi cung ứng. DeepSeek nói mô hình mới tương thích sâu với chip Ascend của Huawei, trong bối cảnh các công ty Trung Quốc vẫn chịu áp lực từ kiểm soát xuất khẩu chip Mỹ. Nếu các mô hình mạnh hơn thực sự chạy tốt trên nền tảng nội địa, Trung Quốc sẽ giảm bớt phụ thuộc vào Nvidia trong những lớp workload nhất định. Đây là tín hiệu vừa công nghệ, vừa địa chính trị.
Từ góc nhìn chiến lược, DeepSeek V4 gây áp lực lên ba nhóm. Thứ nhất là các lab Mỹ, vì họ phải chứng minh phần chênh giá lớn thực sự đem lại giá trị vượt trội. Thứ hai là các nhà cung cấp hạ tầng, vì khách hàng sẽ ngày càng so ROI giữa GPU đắt đỏ và các lựa chọn tiết kiệm hơn. Thứ ba là các startup ứng dụng AI, vì rào cản chi phí đang hạ xuống, kéo theo cạnh tranh ứng dụng tăng lên. Rủi ro lớn nhất là benchmark preview chưa phản ánh đầy đủ độ ổn định vận hành thực tế, nhưng ngay cả trong kịch bản đó, DeepSeek đã đạt mục tiêu quan trọng: kéo mặt bằng kỳ vọng giá của AI đi xuống thêm một nấc.