- DeepSeek는 V4-Pro의 75% 할인 정책을 영구화하여 입력 100만 토큰당 0.435달러, 출력 0.87달러로 가격을 낮췄다.
- 샤오미는 MiMo-V2.5 API 가격을 99% 인하하며 시장에 충격을 주었으며, Pro 버전의 캐시 토큰 비용은 100만 토큰당 약 0.0036달러에 불과하다.
- 샤오미의 100달러 Max 패키지는 기존 16억 토큰에서 대폭 늘어난 820억 토큰(약 600억 단어 상당)을 제공한다.
- 샤오미에 따르면 KV Cache 개선을 통해 저장 및 처리 비용을 약 80% 절감했으며, 손익분기점에 근접한 운영이 가능해졌다.
- DeepSeek V4-Pro는 SWE-Verified에서 80.6%를 기록해 Claude Opus 4.6(80.8%)에 근접했으나, 출력 비용은 약 34배 저렴하다.
- GPT-5.5는 출력 가격을 100만 토큰당 30달러로 인상했고, Claude Opus 4.7의 새로운 토크나이저는 실제 토큰 수를 최대 35% 증가시킬 수 있다.
- MiniMax M2.7, Kimi K2.5, GLM-5.1 등 중국의 다른 첨단 AI 모델들도 미국 경쟁사들에 비해 비용이 현저히 낮다.
- 현재 중국과 미국의 주요 AI 모델 간 비용 격차는 15~30배에 달하며, 캐시를 자주 사용하는 AI 에이전트 애플리케이션의 경우 그 격차는 더욱 벌어진다.
📌 AI 전쟁이 성능 경쟁에서 비용 경쟁으로 이동하고 있다. DeepSeek와 샤오미는 단순히 몇 퍼센트 인하하는 것이 아니라 미국 주요 모델 대비 AI 비용을 98~99%까지 끌어내리고 있다. 성능은 GPT나 Claude에 근접하면서 가격은 수십 배 저렴해지자, AI 에이전트 도입이나 문서 처리, 대규모 자동화를 추진하는 기업들이 운영 비용을 획기적으로 줄이기 위해 오픈소스나 중국 모델로 전환할 강력한 유인이 생기고 있다.

