DeepSeek-Prover-V2-671B 新模型开源发布：AI 推理领域迎来新变革

54 阅读 0 评论 0 点赞 AI原创

DeepSeek-Prover-V2-671B模型架构图

昨天下午，我在浏览 Hugging Face 社区时，意外发现 DeepSeek 发布了一款全新的开源模型 —— DeepSeek-Prover-V2-671B。这款模型的发布在 AI 圈内迅速引发了热议，尤其是它所采用的 safetensors 文件格式，让开发者们眼前一亮。

一、与前代模型的对比

作为一名长期关注 AI 模型发展的爱好者，我第一时间对比了这次的新模型与其前代版本的变化。DeepSeek 自从 2023 年 11 月推出 V1 版本以来，一路高歌猛进，在短短一年多时间内就完成了从参与“百模大战”到对标 GPT-4o 的蜕变。

V3 版本就已经达到了国际领先水平，而如今的 Prover-V2 更是将推理能力推向了一个新的高度。

此次发布的 DeepSeek-Prover-V2-671B 采用了 safetensors 格式，这是一种更安全、更高效的模型存储方式。相比于传统的 PyTorch 模型文件，safetensors 能够有效防止恶意代码注入，并且加载速度更快，内存占用更低。

模型训练数据分布图表

据官方文档介绍，Prover-V2 在数学证明生成方面表现出色，尤其在 AIME 等竞赛级任务中表现亮眼。这让我想起了前几天看到的一篇关于快手开源 SRPO 训练方法的文章，两者在数学推理方向上都有着各自独特的创新。

值得一提的是，该模型还融合了近期一些前沿研究成果，比如 Hyper-RAG 技术，通过构建超图结构来提升知识表示的完整性，从而降低模型的幻觉现象。

自 DeepSeek-R1 开源以来，社区活跃度一直居高不下。就在一个月前，他们启动了 “Open Source Week”，一周内连续开源了五个代码库，令人振奋。

这次 Prover-V2 的发布，无疑再次点燃了开发者们的热情。

我注意到 GitHub 上已经有人开始提交 issue 和 PR，有些用户甚至已经开始尝试将其应用于实际项目中，比如自动定理验证、逻辑推理辅助编程等场景。

随着 DeepSeek 不断推进其开源战略，越来越多的研究者和技术人员可以从中受益。尤其是在大模型成本居高不下的今天，像 DeepSeek 这样提供高性能低成本方案的企业，正在成为推动 AI 发展的重要力量。

作为一名个人开发者，我也计划尝试部署这套模型，看看能否结合之前在 CODEI/O 数据集上的经验，做一些新的实验。

最后，如果你也对 AI 推理模型感兴趣，不妨前往 Hugging Face 下载 DeepSeek-Prover-V2-671B，亲自体验一下它的强大之处。