深度学习

美团开源INT8无损满血版DeepSeek R1,AI领域迎来新突破

美团搜推机器学习团队开源了INT8无损满血版DeepSeek R1模型,实现了对原生FP8模型的基本无损量化,大幅降低了硬件要求并提升了性能。本文从技术实现、实际应用及未来展望等多个角度,详细解读了这一重要成果。

DeepSeek-V3-0324发布,这次V3版本有哪些令人惊艳的改进?

作为一名热爱AI技术的人,我深入研究了DeepSeek-V3-0324版本的特性,发现它在性能、代码与数学能力、成本效率以及社区支持等方面都有显著提升。生成速度达到60 TPS,比V2.5快了三倍;同时开源了FP8权重并提供BF16转换脚本,方便社区适配。这些改进让我对AI领域未来充满期待。

DeepSeek的思维链:真实思考还是模拟人类?

本文探讨了DeepSeek模型展示的思维链是否是其真实思考过程,还是为了更像人类而设计的。通过对比DeepSeek与GPT在文化批判任务中的表现,以及分析透明化思维链的意义和潜在风险,文章提出了对未来AI技术发展的思考。

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布

作为一名关注科技发展的个人,我目睹了DeepSeek R2的提前发布及其带来的巨大影响。从刘慈欣对未来科幻创作的思考,到中美之间围绕AI技术展开的竞争,再到全新推理时Scaling论文的发布,每一个细节都让我感受到人工智能领域的快速进步。在这篇文章中,我将带你深入了解DeepSeek R2背后的故事以及它可能带来的改变。