深度学习 - 头条X

DeepSeek开源周第二弹：DeepEP全栈通信库引发AI圈热议

DeepSeek在开源周第二天发布了DeepEP全栈通信库，该工具通过优化GPU间的信息传输效率，有效缓解了AI从业者的算力焦虑。本文从个人视角出发，详细解析了DeepEP的技术特点及其对行业的影响，同时探讨了DeepSeek与国产大模型的竞争态势。

头条热点 2025年02月26日 01:56 0 点赞 0 评论 98 浏览

浙大校友革新Transformer，多token注意力让LLM错误率归零！

作为一名技术爱好者，他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能，还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势，他看到了这项技术在未来AI领域的巨大潜力。

36KR热点 2025年04月04日 08:47 0 点赞 0 评论 98 浏览

DeepSeek爆火背后：不可忽视的三大趋势

本文深入探讨了DeepSeek爆火背后的三大趋势，包括架构创新、低成本训练模式以及开源生态的建设，揭示了AI产业未来的发展方向。

36KR热点 2025年02月21日 17:23 0 点赞 0 评论 98 浏览

历史分水岭：DeepSeek GitHub星数超越OpenAI，低成本推理模型如何撼动行业？

DeepSeek在GitHub上的星数超越OpenAI，标志着AI领域的重要转折点。本文从价格优势、开源战略、成本优化等多个角度深入解析DeepSeek的成功秘诀，并探讨其对未来AI行业的影响。

36KR热点 2025年02月08日 11:21 0 点赞 0 评论 98 浏览

实测o3/o4-mini：3分钟解决欧拉问题，OpenAI最强模型名副其实

作为一名科技爱好者，他深入研究了OpenAI最新发布的o3和o4-mini两款推理模型。经过实际测试发现，o4-mini在解决复杂问题时表现出惊人的速度，仅用2分55秒便完成了原本需要30分钟才能解决的Project Euler问题。同时，o3在数学推理等领域也有出色表现。两者各具特色，将在科研、教育等多个领域发挥重要作用。

36KR热点 2025年04月19日 13:00 0 点赞 0 评论 98 浏览