低成本高效率:李飞飞团队用不到50美元训练新模型,AI领域迎来革命性突破 李飞飞教授带领团队用不到50美元成功训练出一款性能卓越的新模型,采用最简化的测试时间扩展方法,仅需让模型训练约1000个问题,即可获得超越传统模型的强大推理能力。 头条热点 2025年02月07日 02:36 0 点赞 0 评论 53 浏览
英伟达与DeepSeek联手:满血版DeepSeek-R1模型性能突破天际 英伟达宣布创造满血DeepSeek-R1模型AI推理性能的世界纪录,本文详细解读了DeepSeek-R1的性能表现、各大厂商的支持情况以及实际应用场景,并对未来算力需求进行了展望。 IT热点 2025年03月19日 21:37 0 点赞 0 评论 45 浏览
深度解析DeepSeek新成果:实习生如何挑大梁,加速AI训练推理 DeepSeek团队发布新论文,介绍改进的稀疏注意力机制NSA,显著加速AI训练推理。梁文锋亲自参与研发,实习生挑大梁,实现技术突破。 36KR热点 2025年02月19日 16:31 0 点赞 0 评论 54 浏览
OpenAI 推出“强化微调”计划:让创建专家大模型更简单了 OpenAI推出了“强化微调”计划,旨在通过特定领域数据对大型语言模型进行优化,使其从“高中水平”提升至“博士级专家”的能力。这项技术将为高校、研究人员和企业提供独特的AI解决方案,特别是在法律、保险、医疗保健、金融和工程等领域。 36KR热点 2024年12月08日 09:56 0 点赞 0 评论 74 浏览
OpenAI发布新模型o3与o4-mini:能“思考”图片的AI意味着什么? 作为一名科技爱好者,他深入探讨了OpenAI最新发布的o3和o4-mini模型的强大功能及其意义。从复杂的推理能力到图像生成的技术革新,这些模型正引领着AI领域的全新发展方向。 知乎热点 2025年04月17日 09:26 0 点赞 0 评论 40 浏览
全球首次!2B复现DeepSeek-R1“啊哈时刻”,纯RL实现多模态推理 本文详细介绍了UCLA等研究团队如何通过纯强化学习复现DeepSeek-R1模型的“啊哈时刻”,以及这一突破对AI技术发展的重要意义。文章从技术原理、实际应用及未来展望等多个角度进行了深入探讨。 36KR热点 2025年03月06日 04:36 0 点赞 0 评论 57 浏览
新版GPT-4o强势登场,反超DeepSeek,奥特曼的下一步是什么? 新版GPT-4o强势超越DeepSeek-R1,成为当前最强大的语言模型之一。本文从成本、性能、行业动态等多个角度分析了GPT-4o的优势,并探讨了奥特曼公司即将发布的GPT-4.5可能带来的影响。 36KR热点 2025年02月17日 17:46 0 点赞 0 评论 47 浏览
深度解析Google DeepMind Gemini 2.5:人工智能的又一次飞跃 作为一名科技爱好者,我亲身体验了Google DeepMind发布的Gemini 2.5系列大模型的强大功能。这款模型具备思维链推理能力,能够在复杂任务中展现出卓越的表现。通过本文,我将带你深入了解Gemini 2.5的创新亮点、与前代模型的对比、实际应用场景以及未来的发展趋势。 知乎热点 2025年03月27日 12:45 0 点赞 0 评论 57 浏览
黄仁勋首次回应DeepSeek:推理与后训练,AI智能的核心之争 英伟达CEO黄仁勋首次公开回应DeepSeek模型,强调推理只是AI智能的一部分,而后训练才是智能的核心。本文从第三方视角解读黄仁勋的观点,并分析DeepSeek对AI行业的影响及未来发展方向。 知乎热点 2025年02月23日 08:35 0 点赞 0 评论 55 浏览
Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」 本文介绍了Jim Fan推荐的2025年必读AI论文清单,包括涵盖领域、阅读方法以及个人感悟等方面内容。 36KR热点 2025年01月10日 10:55 0 点赞 0 评论 80 浏览