- DeepSeek ha reso permanente lo sconto del 75% su V4-Pro, abbassando i prezzi a 0,435 USD per milione di token in ingresso e 0,87 USD per milione di token in uscita.
- Xiaomi ha scioccato il mercato riducendo il prezzo dell’API MiMo-V2.5 del 99%, con costi di cache dei token di circa 0,0036 USD per milione di token sulla versione Pro.
- Il pacchetto Max da 100 USD di Xiaomi offre ora 82 miliardi di token, un enorme aumento rispetto ai precedenti 1,6 miliardi, equivalenti a oltre 60 miliardi di parole.
- Secondo Xiaomi, i miglioramenti della KV Cache hanno ridotto i costi di archiviazione e processing di circa l’80%, consentendo al sistema di operare quasi in pareggio.
- DeepSeek V4-Pro ha ottenuto l’80,6% su SWE-Verified, quasi quanto Claude Opus 4.6 (80,8%), ma con un costo di output circa 34 volte inferiore.
- GPT-5.5 ha aumentato il prezzo dell’output a 30 USD per milione di token, mentre il nuovo tokenizer di Claude Opus 4.7 potrebbe aumentare il numero effettivo di token fino al 35%.
- Altri modelli cinesi avanzati come MiniMax M2.7, Kimi K2.5 e GLM-5.1 hanno costi significativamente inferiori rispetto ai concorrenti statunitensi.
- Il divario di costo tra i principali modelli cinesi e statunitensi oscilla attualmente tra 15 e 30 volte, ed è ancora maggiore per le applicazioni di AI Agent che usano frequentemente la cache.
📌 La guerra dell’IA si sta spostando dalla competizione sulle prestazioni a quella sui costi. DeepSeek e Xiaomi non stanno solo riducendo i prezzi di pochi punti percentuali, ma stanno abbassando i costi dell’IA fino al 98–99% rispetto ai principali modelli statunitensi. Con prestazioni vicine a GPT e Claude ma prezzi decine di volte inferiori, le aziende che implementano AI Agent, elaborazione di documenti e automazione su larga scala hanno forti incentivi a passare a modelli open-source o cinesi per ridurre drasticamente i costi operativi.
