- DeepSeek a rendu permanente sa remise de 75 % sur V4-Pro, abaissant les prix à 0,435 USD pour 1 million de tokens d’entrée et 0,87 USD pour 1 million de tokens de sortie.
- Xiaomi a choqué le marché en réduisant les prix de l’API MiMo-V2.5 de 99 %, avec des coûts de cache de tokens d’environ 0,0036 USD pour 1 million de tokens sur la version Pro.
- Le forfait Max à 100 USD de Xiaomi offre désormais 82 milliards de tokens, une augmentation massive par rapport aux 1,6 milliard précédents, soit plus de 60 milliards de mots.
- Selon Xiaomi, les améliorations du KV Cache ont réduit les coûts de stockage et de traitement d’environ 80 %, permettant au système de fonctionner proche du seuil de rentabilité.
- DeepSeek V4-Pro a obtenu 80,6 % sur SWE-Verified, presque autant que Claude Opus 4.6 (80,8 %), mais avec un coût de sortie environ 34 fois inférieur.
- GPT-5.5 a augmenté son prix de sortie à 30 USD pour 1 million de tokens, tandis que le nouveau tokenizer de Claude Opus 4.7 pourrait augmenter le nombre réel de tokens jusqu’à 35 %.
- D’autres modèles chinois avancés comme MiniMax M2.7, Kimi K2.5 et GLM-5.1 sont également nettement moins chers que leurs concurrents américains.
- L’écart de coût entre les principaux modèles d’IA chinois et américains varie actuellement de 15 à 30 fois, et est encore plus important pour les applications d’IA Agent utilisant fréquemment le cache.
📌 La guerre de l’IA passe d’une compétition sur les performances à une compétition sur les coûts. DeepSeek et Xiaomi ne se contentent pas de réduire les prix de quelques pourcents, ils font chuter les coûts de l’IA de 98 à 99 % par rapport à de nombreux modèles américains de premier plan. Alors que les performances approchent celles de GPT et Claude mais que les prix sont des dizaines de fois inférieurs, les entreprises déployant des agents d’IA, du traitement de documents et de l’automatisation à grande échelle sont fortement incitées à passer à l’open-source ou aux modèles chinois pour réduire considérablement leurs coûts d’exploitation.

