DeepSeek爆火后,Kimi、豆包等AI产品现状如何? 本文探讨了DeepSeek爆火后,Kimi、豆包等AI产品的现状及面临的挑战,分析了行业未来的发展趋势。 36KR热点 2025年02月20日 15:42 0 点赞 0 评论 95 浏览
深度揭秘:GPT核心机密意外曝光背后的真相 本文从小明的视角出发,详细解读了微软论文意外曝光GPT核心机密事件。通过分析4o-mini和o1模型的特点以及GPT的技术原理,探讨了这一发现对AI行业的深远影响。 36KR热点 2025年01月02日 21:57 0 点赞 0 评论 108 浏览
浙大校友革新Transformer,多token注意力让LLM错误率归零! 作为一名技术爱好者,他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能,还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势,他看到了这项技术在未来AI领域的巨大潜力。 36KR热点 2025年04月04日 08:47 0 点赞 0 评论 98 浏览
DeepSeek开源周的第二枚王炸:FlashMLA背后的秘密 本文从个人视角出发,详细解析了DeepSeek开源周发布的FlashMLA项目,探讨其技术特点及开源战略意义,并对未来发展趋势进行了展望。 36KR热点 2025年02月26日 10:50 0 点赞 0 评论 118 浏览
低成本高效率:李飞飞团队用不到50美元训练新模型,AI领域迎来革命性突破 李飞飞教授带领团队用不到50美元成功训练出一款性能卓越的新模型,采用最简化的测试时间扩展方法,仅需让模型训练约1000个问题,即可获得超越传统模型的强大推理能力。 头条热点 2025年02月07日 02:36 0 点赞 0 评论 108 浏览
英伟达与DeepSeek联手:满血版DeepSeek-R1模型性能突破天际 英伟达宣布创造满血DeepSeek-R1模型AI推理性能的世界纪录,本文详细解读了DeepSeek-R1的性能表现、各大厂商的支持情况以及实际应用场景,并对未来算力需求进行了展望。 IT热点 2025年03月19日 21:37 0 点赞 0 评论 80 浏览
深度解析DeepSeek新成果:实习生如何挑大梁,加速AI训练推理 DeepSeek团队发布新论文,介绍改进的稀疏注意力机制NSA,显著加速AI训练推理。梁文锋亲自参与研发,实习生挑大梁,实现技术突破。 36KR热点 2025年02月19日 16:31 0 点赞 0 评论 103 浏览
OpenAI 推出“强化微调”计划:让创建专家大模型更简单了 OpenAI推出了“强化微调”计划,旨在通过特定领域数据对大型语言模型进行优化,使其从“高中水平”提升至“博士级专家”的能力。这项技术将为高校、研究人员和企业提供独特的AI解决方案,特别是在法律、保险、医疗保健、金融和工程等领域。 36KR热点 2024年12月08日 09:56 0 点赞 0 评论 112 浏览
OpenAI发布新模型o3与o4-mini:能“思考”图片的AI意味着什么? 作为一名科技爱好者,他深入探讨了OpenAI最新发布的o3和o4-mini模型的强大功能及其意义。从复杂的推理能力到图像生成的技术革新,这些模型正引领着AI领域的全新发展方向。 知乎热点 2025年04月17日 09:26 0 点赞 0 评论 71 浏览
全球首次!2B复现DeepSeek-R1“啊哈时刻”,纯RL实现多模态推理 本文详细介绍了UCLA等研究团队如何通过纯强化学习复现DeepSeek-R1模型的“啊哈时刻”,以及这一突破对AI技术发展的重要意义。文章从技术原理、实际应用及未来展望等多个角度进行了深入探讨。 36KR热点 2025年03月06日 04:36 0 点赞 0 评论 94 浏览