DeepSeek技术解析:如何冲击英伟达两大壁垒? 本文从个人视角出发,详细解析了DeepSeek如何通过技术创新冲击英伟达的技术壁垒,并探讨了AI产业未来的发展趋势。文章涵盖DeepSeek的技术特点、英伟达的优势分析以及双方的竞争态势。 36KR热点 2025年02月08日 15:36 0 点赞 0 评论 92 浏览
腾讯混元T1模型发布:超快吐字、秒回消息,深度推理能力惊艳 作为一名科技爱好者,我被腾讯发布的混元T1模型深深吸引。这款基于混元Turbo S打造的推理模型,不仅吐字快、能秒回,还特别擅长处理超长文本内容。通过大规模强化学习以及专项优化,混元T1在多项基准测试中取得了优异成绩。从金融到教育再到医疗,它的应用场景十分广泛,未来潜力无限。 IT热点 2025年03月23日 09:18 0 点赞 0 评论 79 浏览
杨植麟与梁文锋的AI论文之争:天才间的碰撞 杨植麟与梁文锋因AI论文引发热议,两人分别代表不同技术路线,探讨稀疏注意力机制的应用前景。本文深入剖析事件始末及背后意义,揭示AI领域未来发展方向。 36KR热点 2025年02月19日 19:45 0 点赞 0 评论 64 浏览
微软Phi-4封神:14B小模型数学击败GPT-4o,合成数据占比40%,36页技术报告出炉 微软推出的14B参数小型语言模型Phi-4在数学推理方面表现出色,超越多个更大规模的模型,如70B的Llama 3.3和72B的Qwen。 Phi-4使用40%合成数据进行训练,并发布了详细的36页技术报告。 36KR热点 2024年12月23日 14:17 0 点赞 0 评论 80 浏览
满血版o3探案神技出圈,大模型要卷搬砖了? 作为一名对人工智能感兴趣的观察者,他深入探讨了满血版o3和o4-mini两款模型的特点及其背后的技术意义。通过生动的案例和详细的分析,展现了大模型从“修仙”到“搬砖”的转变过程。 36KR热点 2025年04月19日 20:41 0 点赞 0 评论 42 浏览
AI推理新突破:Dynasor-CoT让对话更高效 本文详细介绍了UCSD和清华大学联合提出的Dynasor-CoT技术,探讨了其在减少AI推理token消耗方面的创新之处,并展望了未来的发展方向。 36KR热点 2025年03月07日 09:42 0 点赞 0 评论 51 浏览
别让你的提问杀死AI!90%的人不会和DeepSeek对话的残酷真相 本文探讨了如何通过改进提问方式提升与AI交互的效率,介绍了苏格拉底式启发式对话方法,并提醒用户注意AI生成内容的潜在风险。 简书热点 2025年02月18日 02:31 0 点赞 0 评论 57 浏览
朱松纯院长:我们是否被美国的AI叙事带偏了? 作为一位长期关注人工智能发展的研究者,他深刻认识到当前AI领域存在的问题。朱松纯认为,仅仅追随美国的技术路线并不能带来真正的突破,反而可能限制自身的创新能力。因此,他提出了一种全新的视角来审视人工智能的发展方向。 知乎热点 2025年04月01日 03:35 0 点赞 0 评论 46 浏览
10分钟搭建DeepSeek R1满血版个人知识库实例指导 本文详细介绍了如何在10分钟内利用DeepSeek R1搭建个人知识库的全过程,从云主机选购到具体配置,再到实际使用体验,全面覆盖,助力用户轻松上手。 简书热点 2025年02月25日 14:11 0 点赞 0 评论 44 浏览
揭开DeepSeek的神秘面纱:中国AI的新突破 本文详细介绍了中国AI公司DeepSeek及其最新发布的DeepSeek-R1模型,探讨了该模型的技术亮点和社会影响,展示了中国在AI领域的创新能力和竞争实力。 微博热点 2025年01月28日 10:47 0 点赞 0 评论 63 浏览