- DeepSeek已将V4-Pro的7.5折优惠转为永久政策,将输入价格降至0.435美元/百万token,输出降至0.87美元/百万token。
- 小米进一步下调MiMo-V2.5 API价格达99%,Pro版缓存token成本仅约0.0036美元/百万token。
- 小米100美元的Max套餐现提供820亿token,较之前的16亿大幅增加,相当于超过600亿个词。
- 据小米称,KV Cache的改进降低了约80%的存储和处理成本,使系统能在接近盈亏平衡点运行。
- DeepSeek V4-Pro在SWE-Verified上获得80.6%的评分,与Claude Opus 4.6(80.8%)基本持平,但输出成本低了约34倍。
- GPT-5.5将输出价格提高到30美元/百万token,而Claude Opus 4.7采用的新分词器可能使实际token数量增加达35%。
- MiniMax M2.7、Kimi K2.5和GLM-5.1等其他中国先进模型的价格也明显低于美国对手。
- 中美顶级AI模型之间的成本差距目前在15到30倍之间,对于频繁使用缓存的AI Agent应用,差距甚至更大。
📌 AI大战正从性能竞争转向成本竞争。DeepSeek和小米不仅是降价百分之几,而是将AI成本拉低到比美国许多领先模型低98%至99%的水平。当性能已接近GPT和Claude但价格低数十倍时,部署AI Agent、文档处理和大规模自动化的企业将有更强的动力转向开源或中国模型,以显著降低运营成本。

