- DeepSeek hat den Rabatt von 75 % auf V4-Pro dauerhaft eingeführt und die Preise auf 0,435 USD pro 1 Mio. Eingabe-Token und 0,87 USD pro 1 Mio. Ausgabe-Token gesenkt.
- Xiaomi schockierte den Markt mit einer Preissenkung der MiMo-V2.5 API um 99 %, wobei die Token-Cache-Kosten bei der Pro-Version nur noch etwa 0,0036 USD pro 1 Mio. Token betragen.
- Xiaomis 100-USD-Max-Paket bietet nun 82 Milliarden Token, eine massive Steigerung gegenüber den bisherigen 1,6 Milliarden Token, was über 60 Milliarden Wörtern entspricht.
- Laut Xiaomi reduzierten KV-Cache-Verbesserungen die Speicher- und Verarbeitungskosten um etwa 80 %, während das System nahe der Gewinnschwelle betrieben werden kann.
- DeepSeek V4-Pro erreichte 80,6 % bei SWE-Verified, fast gleichauf mit Claude Opus 4.6 (80,8 %), aber bei 34-mal niedrigeren Ausgabekosten.
- GPT-5.5 erhöhte den Ausgabepreis auf 30 USD pro 1 Mio. Token, während der neue Tokenizer von Claude Opus 4.7 die tatsächliche Token-Anzahl um bis zu 35 % erhöhen könnte.
- Andere fortschrittliche chinesische Modelle wie MiniMax M2.7, Kimi K2.5 und GLM-5.1 sind ebenfalls deutlich günstiger als ihre US-Konkurrenten.
- Die Kostenlücke zwischen führenden chinesischen und US-amerikanischen KI-Modellen liegt derzeit beim 15- bis 30-fachen, bei KI-Agent-Anwendungen mit häufiger Cache-Nutzung sogar noch höher.
📌 Der KI-Krieg verlagert sich vom Leistungswettbewerb zum Kostenwettbewerb. DeepSeek und Xiaomi senken die Preise nicht nur um einige Prozent, sondern drücken die KI-Kosten um 98–99 % unter das Niveau vieler führender US-Modelle. Da die Leistung fast an GPT und Claude heranreicht, die Preise aber um das Dutzendfache niedriger sind, haben Unternehmen, die KI-Agenten, Dokumentenverarbeitung und großflächige Automatisierung einsetzen, starke Anreize, auf Open-Source- oder chinesische Modelle umzusteigen, um die Betriebskosten drastisch zu senken.
