博弈论入门:当博弈论遇上机器学习 本文从个人视角出发,探讨了博弈论与机器学习的结合,介绍了博弈论在支持向量机(SVM)、生成对抗网络(GAN)和强化学习中的应用,并展望了未来的发展方向。 简书热点 2024年12月04日 02:20 0 点赞 0 评论 72 浏览
预训练新突破!港中文清华提出「三位一体」框架,模型自我进化不再是梦 作为一名对人工智能充满热情的研究者,他深入探讨了港中文、清华等高校提出的「三位一体」框架,并详细解析了这一框架如何突破预训练模型的瓶颈,赋予模型持续自我进化的可能性。通过实际案例分析,展示了该框架在未来各领域的广泛应用前景。 36KR热点 2025年04月11日 21:45 0 点赞 0 评论 47 浏览
DeepSeek开源项目FlashMLA:不容错过的亮点解析 本文深入探讨了DeepSeek开源周第一天发布的项目FlashMLA的亮点与意义,分析其对AI领域的潜在影响,并结合实际案例进行解读。 知乎热点 2025年02月24日 22:42 0 点赞 0 评论 51 浏览
奥特曼,杨植麟的理想型?——从大模型创业到数学推理模型的探索 本文从个人视角出发,深入探讨了杨植麟从循环科技到月之暗面的创业历程,以及他最新发布的数学推理模型k0-math的技术突破。文章结合了杨植麟的创业心得和个人感悟,展现了他在AI领域的探索与坚持。 36KR热点 2024年12月14日 13:57 0 点赞 0 评论 86 浏览
深度强化学习的学习建议与实战心得 他在知乎上看到关于深度强化学习的问题后,回忆起自己学习的过程,并分享了从基础数学到编程技能,再到经典算法的研究经验。同时,他还介绍了实践中的几个关键技巧,包括环境选择、模型调试以及日志记录的重要性。最后,他对深度强化学习的未来发展充满期待,认为尽管存在诸多挑战,但凭借不断的努力和技术进步,这一领域必将迎来更加辉煌的明天。 知乎热点 2025年04月29日 09:16 0 点赞 0 评论 44 浏览
全球首次!2B复现DeepSeek-R1“啊哈时刻”,纯RL实现多模态推理 本文详细介绍了UCLA等研究团队如何通过纯强化学习复现DeepSeek-R1模型的“啊哈时刻”,以及这一突破对AI技术发展的重要意义。文章从技术原理、实际应用及未来展望等多个角度进行了深入探讨。 36KR热点 2025年03月06日 04:36 0 点赞 0 评论 57 浏览
AMD火速“站台”DeepSeek:AI领域的强强联合 AMD宣布将DeepSeek-V3模型集成到最新GPU上,标志着两家公司在AI领域的深度合作。本文深入探讨了这一合作背后的意义及未来前景。 头条热点 2025年01月27日 00:37 0 点赞 0 评论 64 浏览
AI科学家横空出世!Nature爆OpenAI黑科技,世界模型+RL成关键 OpenAI首席科学家近日在《Nature》爆料称,AI系统已实现自主科学发现,世界模型和强化学习成为关键技术支撑。文章探讨了AI科学家的能力边界、核心技术原理,并对比了中国企业如万兴科技、昆仑万维、深度求索等在全球AI科研赛道上的布局。 36KR热点 2025年05月14日 04:36 0 点赞 0 评论 48 浏览
Atlas机器人进化记:从翻跟头到工厂打工,人形机器人的未来已来 Atlas机器人通过强化学习实现了翻跟头、跳舞等复杂动作,并逐步应用于工业领域。本文从技术原理、应用场景及未来展望等方面深入探讨了这一现象。 36KR热点 2025年03月21日 08:41 0 点赞 0 评论 52 浏览
DeepSeek-R1 持续刷屏,连 Open R1 都来了!抱抱脸发起,1 天狂揽 1.9k 星 DeepSeek-R1 开源大模型在 GitHub 上一夜走红,1 天内获得 1.9k 标星。该模型不仅在多项基准测试中表现出色,还在开源社区中掀起了巨大波澜。 IT热点 2025年01月27日 13:10 0 点赞 0 评论 65 浏览