古董GPU也能跑DeepSeek同款GRPO,显存只需1/10,上下文爆涨10倍! 文章探讨了如何通过优化GRPO算法,让老旧GPU也能高效运行DeepSeek同款模型,显存需求仅为原来的1/10,上下文长度提升10倍,极大降低了AI开发门槛。 36KR热点 2025年03月11日 12:50 0 点赞 0 评论 77 浏览
xAI 推出 Grok 3 和 Deepsearch:重新定义人工智能的未来 文章详细介绍了埃隆·马斯克旗下xAI公司推出的Grok 3聊天机器人和Deepsearch智能搜索引擎的亮点,包括“思维链”推理机制、超大规模参数、语义分析能力等,并探讨了这些技术对未来的影响。 知乎热点 2025年02月18日 19:20 0 点赞 0 评论 88 浏览
DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布 作为一名关注科技发展的个人,我目睹了DeepSeek R2的提前发布及其带来的巨大影响。从刘慈欣对未来科幻创作的思考,到中美之间围绕AI技术展开的竞争,再到全新推理时Scaling论文的发布,每一个细节都让我感受到人工智能领域的快速进步。在这篇文章中,我将带你深入了解DeepSeek R2背后的故事以及它可能带来的改变。 36KR热点 2025年04月04日 21:45 0 点赞 0 评论 70 浏览
深度解析DeepSeek开源周:从FlashMLA到DeepEP,大模型开源的未来 本文详细解析了DeepSeek开源周的首个成果FlashMLA及其后续计划,探讨了开源对AI行业的影响,并展望了未来的发展趋势。 百度热点 2025年02月26日 13:10 0 点赞 0 评论 69 浏览
新王诞生:DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史 DeepSeek双模型GitHub Star数首次超越OpenAI,成为大模型领域新标杆。本文深入分析DeepSeek的技术创新、低成本策略及对行业的深远影响,探讨开源模式如何改变AI发展轨迹。 IT热点 2025年02月08日 00:01 0 点赞 0 评论 78 浏览
OpenAI新模型o3/o4-mini发布,图像思考与视觉推理能力震撼登场 作为一名关注人工智能发展的爱好者,他被OpenAI最新发布的o3/o4-mini模型深深吸引。这些新模型不仅在视觉推理方面达到了前所未有的高度,还首次实现了图像思考功能。通过深入研究相关资料,他对这一技术突破有了更全面的认识。 36KR热点 2025年04月17日 11:02 0 点赞 0 评论 95 浏览
PyTorch灵魂人物的出走:ChatGPT之母背后的故事 PyTorch灵魂人物放弃大厂offer,选择加入ChatGPT之母OpenAI,与Ilya奥特曼携手共创未来。本文深入探讨了他的职业选择背后的原因及对未来的影响。 36KR热点 2025年03月06日 10:20 0 点赞 0 评论 79 浏览
天才少女罗福莉的新征程:从AI实验室到职场新岗位 95后AI天才少女罗福莉已正式到新岗位上班,她的职业生涯新篇章引发广泛关注。本文详细回顾了罗福莉的成长历程、职业选择以及她在新岗位上的表现,同时展望了她在AI领域的未来发展。 百度热点 2025年02月18日 00:26 0 点赞 0 评论 69 浏览
揭秘老黄演讲中的关键技术:PD分离,UCSD华人团队如何让LLM吞吐量跃升4倍 老黄在GTC大会上的演讲引发了广泛关注,其中提到的PD分离技术成为焦点。本文详细解读了这项技术的原理及其背后的UCSD华人团队研究成果,揭示了其如何让LLM吞吐量跃升4倍。 36KR热点 2025年03月20日 13:17 0 点赞 0 评论 83 浏览
全球华人见证AI巅峰对决:Grok 3险胜DeepSeek,马斯克再创奇迹 本文详细介绍了马斯克旗下xAI公司推出的Grok 3大模型在全球范围内的表现及其与DeepSeek、OpenAI等竞争对手之间的激烈角逐。通过深入分析各模型的技术特点和发展趋势,探讨了未来AI领域的潜在发展方向。 36KR热点 2025年02月19日 17:30 0 点赞 0 评论 72 浏览