小米开源首个推理大模型Xiaomi MiMo，性能惊艳登顶！

60 阅读 0 评论 0 点赞 AI原创

文章导读：

小米推出推理大模型Xiaomi MiMo

今天，我在知乎上刷到一个热搜：“小米开源首个为推理而生的大模型Xiaomi MiMo”，作为一个长期关注AI动态的技术爱好者，我立刻点进去看详情。原来在4月30日，小米正式宣布开源其首个专注于推理能力的大模型——Xiaomi MiMo。

这款模型基于7B参数（70亿）设计，在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）等公开测评中表现出色，甚至超越了OpenAI的闭源推理模型o1-mini以及阿里更大规模的开源推理模型。

小米官方表示，MiMo从预训练到后训练阶段都进行了深度优化，专门针对推理任务进行建模训练。这种针对性优化使得它在处理复杂逻辑、多步骤解题等场景时具备更强的能力。

比如在数学推理方面，MiMo在AIME 24-25测试集中的准确率显著提升；而在LiveCodeBench v5这类代码生成与调试任务中，MiMo也展现出了极高的完成度和效率。

“MiMo仅用7B参数就达到了比部分百亿级模型更优的效果。” —— 中文科技资讯报道

值得一提的是，就在昨天，阿里巴巴也发布了新一代通义千问模型Qwen3，同样主打推理能力。但不同的是，Qwen3是混合推理模型，结合了“快思考”与“慢思考”，适用于更多元化的应用场景。

虽然Qwen3参数量只有DeepSeek-R1的三分之一，但在成本和性能上都有明显优势。不过，小米的MiMo则专注在单一推理方向上做到极致，尤其是在小参数量下的高精度输出。

小米此次开源MiMo，不仅展示了其在AI领域的技术实力，也为开发者提供了一个高效、低成本的推理模型选择。尤其对于资源有限但追求精准推理效果的小团队或个人开发者来说，MiMo无疑是一个福音。

此外，MiMo的出现也进一步激发了国内大厂在大模型领域的竞争活力。随着阿里、百度等企业的不断发力，中国AI生态正在逐步形成自己的特色与优势。

如果你对推理模型感兴趣，不妨去GitHub上试试MiMo的实际表现，说不定会有意想不到的收获哦～