奥特曼,杨植麟的理想型?——从大模型创业到数学推理模型的探索 本文从个人视角出发,深入探讨了杨植麟从循环科技到月之暗面的创业历程,以及他最新发布的数学推理模型k0-math的技术突破。文章结合了杨植麟的创业心得和个人感悟,展现了他在AI领域的探索与坚持。 36KR热点 2024年12月14日 13:57 0 点赞 0 评论 96 浏览
深度强化学习的学习建议与实战心得 他在知乎上看到关于深度强化学习的问题后,回忆起自己学习的过程,并分享了从基础数学到编程技能,再到经典算法的研究经验。同时,他还介绍了实践中的几个关键技巧,包括环境选择、模型调试以及日志记录的重要性。最后,他对深度强化学习的未来发展充满期待,认为尽管存在诸多挑战,但凭借不断的努力和技术进步,这一领域必将迎来更加辉煌的明天。 知乎热点 2025年04月29日 09:16 0 点赞 0 评论 59 浏览
全球首次!2B复现DeepSeek-R1“啊哈时刻”,纯RL实现多模态推理 本文详细介绍了UCLA等研究团队如何通过纯强化学习复现DeepSeek-R1模型的“啊哈时刻”,以及这一突破对AI技术发展的重要意义。文章从技术原理、实际应用及未来展望等多个角度进行了深入探讨。 36KR热点 2025年03月06日 04:36 0 点赞 0 评论 67 浏览
AMD火速“站台”DeepSeek:AI领域的强强联合 AMD宣布将DeepSeek-V3模型集成到最新GPU上,标志着两家公司在AI领域的深度合作。本文深入探讨了这一合作背后的意义及未来前景。 头条热点 2025年01月27日 00:37 0 点赞 0 评论 72 浏览
AI科学家横空出世!Nature爆OpenAI黑科技,世界模型+RL成关键 OpenAI首席科学家近日在《Nature》爆料称,AI系统已实现自主科学发现,世界模型和强化学习成为关键技术支撑。文章探讨了AI科学家的能力边界、核心技术原理,并对比了中国企业如万兴科技、昆仑万维、深度求索等在全球AI科研赛道上的布局。 36KR热点 2025年05月14日 04:36 0 点赞 0 评论 60 浏览
Atlas机器人进化记:从翻跟头到工厂打工,人形机器人的未来已来 Atlas机器人通过强化学习实现了翻跟头、跳舞等复杂动作,并逐步应用于工业领域。本文从技术原理、应用场景及未来展望等方面深入探讨了这一现象。 36KR热点 2025年03月21日 08:41 0 点赞 0 评论 66 浏览
DeepSeek-R1 持续刷屏,连 Open R1 都来了!抱抱脸发起,1 天狂揽 1.9k 星 DeepSeek-R1 开源大模型在 GitHub 上一夜走红,1 天内获得 1.9k 标星。该模型不仅在多项基准测试中表现出色,还在开源社区中掀起了巨大波澜。 IT热点 2025年01月27日 13:10 0 点赞 0 评论 75 浏览
从感知到预判:世界模型助力自动驾驶超越‘老司机’瓶颈 这篇文章深入探讨了世界模型在自动驾驶领域的应用,从感知到预判等多个方面进行了详细的阐述。同时,也提到了当前面临的一些挑战以及未来的发展前景。 36KR热点 2025年07月18日 17:16 0 点赞 0 评论 40 浏览
如何评价波士顿动力2025年3月19日发布的Atlas机器人强化学习行走视频? 本文从个人视角出发,详细解读了波士顿动力2025年3月19日发布的Atlas机器人演示视频,分析其背后的技术突破及行业影响。 知乎热点 2025年03月21日 15:36 0 点赞 0 评论 54 浏览
DeepSeek为什么这么火? 本文深入探讨了DeepSeek为何能在短时间内迅速走红,分析了其在性能、成本和技术上的多重优势,并展望了其未来的发展前景。 知乎热点 2025年01月28日 21:42 0 点赞 0 评论 80 浏览