DeepSeek开源周第二弹:DeepEP全栈通信库引发AI圈热议 DeepSeek在开源周第二天发布了DeepEP全栈通信库,该工具通过优化GPU间的信息传输效率,有效缓解了AI从业者的算力焦虑。本文从个人视角出发,详细解析了DeepEP的技术特点及其对行业的影响,同时探讨了DeepSeek与国产大模型的竞争态势。 头条热点 2025年02月26日 01:56 0 点赞 0 评论 98 浏览
浙大校友革新Transformer,多token注意力让LLM错误率归零! 作为一名技术爱好者,他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能,还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势,他看到了这项技术在未来AI领域的巨大潜力。 36KR热点 2025年04月04日 08:47 0 点赞 0 评论 98 浏览
DeepSeek爆火背后:不可忽视的三大趋势 本文深入探讨了DeepSeek爆火背后的三大趋势,包括架构创新、低成本训练模式以及开源生态的建设,揭示了AI产业未来的发展方向。 36KR热点 2025年02月21日 17:23 0 点赞 0 评论 98 浏览
历史分水岭:DeepSeek GitHub星数超越OpenAI,低成本推理模型如何撼动行业? DeepSeek在GitHub上的星数超越OpenAI,标志着AI领域的重要转折点。本文从价格优势、开源战略、成本优化等多个角度深入解析DeepSeek的成功秘诀,并探讨其对未来AI行业的影响。 36KR热点 2025年02月08日 11:21 0 点赞 0 评论 98 浏览
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实 作为一名科技爱好者,他深入研究了OpenAI最新发布的o3和o4-mini两款推理模型。经过实际测试发现,o4-mini在解决复杂问题时表现出惊人的速度,仅用2分55秒便完成了原本需要30分钟才能解决的Project Euler问题。同时,o3在数学推理等领域也有出色表现。两者各具特色,将在科研、教育等多个领域发挥重要作用。 36KR热点 2025年04月19日 13:00 0 点赞 0 评论 98 浏览
体验新版GPT-4o后,我为何要感谢DeepSeek? 本文以第一人称视角详细记录了作者对新版GPT-4o的使用体验,并探讨了OpenAI在成人内容政策上的调整。同时,文章表达了对DeepSeek公司的感谢,强调其在AI领域的独特贡献。 36KR热点 2025年02月19日 19:42 0 点赞 0 评论 98 浏览
DeepSeek爆火后,Kimi、豆包等AI产品现状如何? 本文探讨了DeepSeek爆火后,Kimi、豆包等AI产品的现状及面临的挑战,分析了行业未来的发展趋势。 36KR热点 2025年02月20日 15:42 0 点赞 0 评论 97 浏览
直逼DeepSeek-R1-32B,碾压李飞飞s1-32B:UC伯克利等开源全新SOTA推理模型 本文详细介绍了由斯坦福、UC伯克利等机构联合发布的全新开源推理模型OpenThinker-32B,分析了其性能优势和技术特点,并探讨了其在实际应用中的潜力及未来发展方向。 36KR热点 2025年02月14日 12:52 0 点赞 0 评论 97 浏览
新王诞生:DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史 DeepSeek双模型GitHub Star数首次超越OpenAI,成为大模型领域新标杆。本文深入分析DeepSeek的技术创新、低成本策略及对行业的深远影响,探讨开源模式如何改变AI发展轨迹。 IT热点 2025年02月08日 00:01 0 点赞 0 评论 97 浏览
古董GPU也能跑DeepSeek同款GRPO,显存只需1/10,上下文爆涨10倍! 文章探讨了如何通过优化GRPO算法,让老旧GPU也能高效运行DeepSeek同款模型,显存需求仅为原来的1/10,上下文长度提升10倍,极大降低了AI开发门槛。 36KR热点 2025年03月11日 12:50 0 点赞 0 评论 96 浏览