5月30日,小米MiMo大模型团队表示,首次完整公开MiMo-V2.5系列大模型API永久降价背后的技术路径。MiMO-V2.5实现了KVCache 双池+SWA-aware 前缀树等五大核心突破,降价后仍能维持收支平衡。MiMo对开发者生态的投入持续加码。日前推出的百万亿Token创造者激励计划,总申请人数超54万人,累计发放100万亿免费Token,折合人民币超6500万元。
突破一:KVCache双池+SWA-aware前缀树。
突破二:GCache分布式缓存。
突破三:KVCache亲和调度。
突破四:Decode阶段MTP加速。
突破五:多模态推理优化。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。