英伟达开源新王登顶!14万H100小时训练细节曝光,DeepSeek-R1再掀AI风暴 英伟达开源新模型 Perception-R1,采用 GRPO 强化学习技术,挑战 DeepSeek-R1 霸主地位。文章深入解析训练细节、成本构成及开源竞争格局。 36KR热点 2025年05月06日 21:51 0 点赞 0 评论 53 浏览
梁文锋与杨植麟同日发论文“撞车”!AI模型之战再掀高潮 2025年2月18日,DeepSeek创始人梁文锋与月之暗面创始人杨植麟几乎同时发布关于Transformer注意力机制优化的新论文,引发业界广泛关注。文章从事件回顾、技术路线对比、创始人背景及未来趋势四个角度深入解析这场AI领域的‘正面交锋’。 36KR热点 2025年05月05日 09:20 0 点赞 0 评论 43 浏览
Qwen3-0.6B这种小模型有什么实际意义和用途吗? Qwen3-0.6B虽然参数量只有6亿,但在实际应用中展现出强大的性能。本文从模型架构、开源策略、应用场景等多个角度解析小模型的价值。 知乎热点 2025年05月02日 22:10 0 点赞 0 评论 33 浏览
Gemini背后的技术秘密,谷歌AI团队如何突破极限? 本文深入探讨了谷歌Gemini AI模型的发展过程及其对未来人工智能的影响。通过分析Gemini的技术挑战与突破,以及其在机器人领域的应用前景,为读者提供了关于下一代AI发展的洞察。 36KR热点 2025年04月29日 11:50 0 点赞 0 评论 50 浏览
谷歌Gemini 2.5 Pro登场:推理成本暴降600%,直追o4-mini 作为一名AI技术爱好者,他见证了谷歌Gemini 2.5 Pro的发布,并深入分析了这款模型的特点、优势及其对行业的深远影响。通过与市场上其他竞争者的对比,展示了Gemini 2.5 Pro在价格和性能上的双重突破,同时也对其未来的应用前景进行了展望。 36KR热点 2025年04月18日 20:53 0 点赞 0 评论 51 浏览
Gemini 2.5编程霸榜,谷歌重回AI王座,奥特曼迎战 作为一名对科技充满热情的人,他见证了Gemini 2.5 Pro这款AI模型带来的震撼变革。从性能飞跃到本地部署环境的引入,再到与奥特曼的对决,每一个环节都让人热血沸腾。 36KR热点 2025年04月15日 08:31 0 点赞 0 评论 47 浏览
DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布 作为一名关注科技发展的个人,我目睹了DeepSeek R2的提前发布及其带来的巨大影响。从刘慈欣对未来科幻创作的思考,到中美之间围绕AI技术展开的竞争,再到全新推理时Scaling论文的发布,每一个细节都让我感受到人工智能领域的快速进步。在这篇文章中,我将带你深入了解DeepSeek R2背后的故事以及它可能带来的改变。 36KR热点 2025年04月04日 21:45 0 点赞 0 评论 57 浏览
谷歌Gemini 2.5 Pro免费了!数学能力碾压研究生,全球TOP1实至名归 他是一位对AI领域充满热情的人,当他得知谷歌Gemini 2.5 Pro免费开放的消息时,立刻深入研究了这款模型的性能。Gemini 2.5 Pro不仅在数学推理能力上超越了人类研究生,还拥有支持百万token上下文窗口的强大处理能力。他认为,这款模型的应用前景将彻底改变教育、医疗、商业等多个领域,并且谷歌将其免费开放的举措将进一步推动AI技术的发展。 36KR热点 2025年04月01日 20:40 0 点赞 0 评论 49 浏览
武汉多家医院接入DeepSeek,AI医疗新纪元的开端 武汉多家医院接入DeepSeek,标志着AI技术在医疗领域的进一步深化应用。本文从个人视角出发,探讨了这一事件对医疗行业及普通患者的影响,并展望了未来AI医疗的发展前景。 百度热点 2025年02月28日 23:55 0 点赞 0 评论 52 浏览
国产GPU助力,摩尔线程实现对DeepSeek蒸馏模型推理服务部署 本文详细介绍了国产GPU与AI模型的结合,尤其是摩尔线程如何成功实现对DeepSeek蒸馏模型的推理服务部署,以及这一成就对国内AI产业的影响。 IT热点 2025年02月04日 23:06 0 点赞 0 评论 64 浏览