- DeepSeek đã biến chương trình giảm giá 75% cho V4-Pro thành chính sách vĩnh viễn, đưa giá xuống còn 0,435 USD cho mỗi triệu token đầu vào và 0,87 USD cho mỗi triệu token đầu ra.
- Xiaomi tiếp tục gây sốc khi giảm giá API MiMo-V2.5 tới 99%, với chi phí token cache chỉ còn khoảng 0,0036 USD cho mỗi triệu token trên bản Pro.
- Gói Max 100 USD của Xiaomi hiện cung cấp 82 tỷ token, tăng mạnh so với 1,6 tỷ token trước đây, tương đương hơn 60 tỷ từ.
- Theo Xiaomi, các cải tiến về KV Cache giúp giảm khoảng 80% chi phí lưu trữ và xử lý, trong khi hệ thống vẫn có thể vận hành gần điểm hòa vốn.
- DeepSeek V4-Pro đạt 80,6% trên SWE-Verified, gần tương đương Claude Opus 4.6 với 80,8%, nhưng chi phí đầu ra thấp hơn khoảng 34 lần.
- GPT-5.5 tăng giá đầu ra lên 30 USD cho mỗi triệu token, còn Claude Opus 4.7 áp dụng tokenizer mới có thể làm số lượng token thực tế tăng tới 35%.
- Nhiều mô hình AI tiên tiến khác của Trung Quốc như MiniMax M2.7, Kimi K2.5 và GLM-5.1 cũng đang có chi phí thấp hơn đáng kể so với các đối thủ Mỹ.
- Khoảng cách chi phí giữa các mô hình AI hàng đầu Trung Quốc và Mỹ hiện dao động từ 15 đến 30 lần, thậm chí còn lớn hơn đối với các ứng dụng AI Agent sử dụng cache thường xuyên.
📌 Cuộc chiến AI đang chuyển từ cạnh tranh hiệu năng sang cạnh tranh chi phí. DeepSeek và Xiaomi không chỉ giảm giá vài phần trăm mà đang kéo chi phí AI xuống mức thấp hơn tới 98–99% so với nhiều mô hình hàng đầu của Mỹ. Khi hiệu năng đã tiệm cận GPT và Claude nhưng giá thấp hơn hàng chục lần, các doanh nghiệp triển khai AI Agent, xử lý tài liệu và tự động hóa quy mô lớn có thêm động lực mạnh để chuyển sang các mô hình nguồn mở hoặc mô hình Trung Quốc nhằm giảm đáng kể chi phí vận hành.
Tổng hợp.

