深度学习 - 头条X

直逼DeepSeek-R1-32B，碾压李飞飞s1-32B：UC伯克利等开源全新SOTA推理模型

本文详细介绍了由斯坦福、UC伯克利等机构联合发布的全新开源推理模型OpenThinker-32B，分析了其性能优势和技术特点，并探讨了其在实际应用中的潜力及未来发展方向。

36KR热点 2025年02月14日 12:52 0 点赞 0 评论 96 浏览

DeepSeek-V3震撼发布：性能飞跃与核心改进全解析

作为一名技术爱好者，我深入了解了DeepSeek-V3的各项改进。从性能提升到核心技术优化，再到开源与社区支持，每个细节都让我惊叹不已。现在就让我们一起探索这款划时代模型的奥秘吧。

知乎热点 2025年03月25日 09:37 0 点赞 0 评论 112 浏览

马斯克的Grok 3免费了！用户为何气得跳脚？

本文详细解读了马斯克旗下xAI公司发布的最新大模型Grok 3，探讨了其强大的性能以及免费政策引发的争议，同时展望了这款AI工具在未来的发展前景。

36KR热点 2025年02月21日 10:45 0 点赞 0 评论 158 浏览

缅怀天才科学家：今天，整个AI圈都在为他默哀

今天，整个AI圈都在缅怀一位刚刚离世的天才科学家李华。本文以第三人称视角叙述了作者与其相识相知的过程以及他对AI领域的巨大贡献。

腾讯热点 2025年01月03日 15:15 0 点赞 0 评论 83 浏览

T细胞分析新突破：MIST模型引领未来医疗科技

作为一名热爱科学的探索者，他深入研究了暨南大学罗钧洪教授团队开发的MIST模型。该模型通过融合scRNA-seq和scTCR-seq数据，为T细胞分析提供了全新视角。他认为，这项技术不仅改变了我们对免疫系统的理解，还将在精准医疗领域发挥重要作用。

简书热点 2025年04月27日 02:51 0 点赞 0 评论 83 浏览

古董GPU也能跑DeepSeek同款GRPO，显存只需1/10，上下文爆涨10倍！

文章探讨了如何通过优化GRPO算法，让老旧GPU也能高效运行DeepSeek同款模型，显存需求仅为原来的1/10，上下文长度提升10倍，极大降低了AI开发门槛。

36KR热点 2025年03月11日 12:50 0 点赞 0 评论 95 浏览

xAI 推出 Grok 3 和 Deepsearch：重新定义人工智能的未来

文章详细介绍了埃隆·马斯克旗下xAI公司推出的Grok 3聊天机器人和Deepsearch智能搜索引擎的亮点，包括“思维链”推理机制、超大规模参数、语义分析能力等，并探讨了这些技术对未来的影响。

知乎热点 2025年02月18日 19:20 0 点赞 0 评论 109 浏览

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布

作为一名关注科技发展的个人，我目睹了DeepSeek R2的提前发布及其带来的巨大影响。从刘慈欣对未来科幻创作的思考，到中美之间围绕AI技术展开的竞争，再到全新推理时Scaling论文的发布，每一个细节都让我感受到人工智能领域的快速进步。在这篇文章中，我将带你深入了解DeepSeek R2背后的故事以及它可能带来的改变。

36KR热点 2025年04月04日 21:45 0 点赞 0 评论 84 浏览

深度解析DeepSeek开源周：从FlashMLA到DeepEP，大模型开源的未来

本文详细解析了DeepSeek开源周的首个成果FlashMLA及其后续计划，探讨了开源对AI行业的影响，并展望了未来的发展趋势。

百度热点 2025年02月26日 13:10 0 点赞 0 评论 85 浏览

新王诞生：DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史

DeepSeek双模型GitHub Star数首次超越OpenAI，成为大模型领域新标杆。本文深入分析DeepSeek的技术创新、低成本策略及对行业的深远影响，探讨开源模式如何改变AI发展轨迹。

IT热点 2025年02月08日 00:01 0 点赞 0 评论 97 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期