深度解析DeepSeek新成果:实习生如何挑大梁,加速AI训练推理 DeepSeek团队发布新论文,介绍改进的稀疏注意力机制NSA,显著加速AI训练推理。梁文锋亲自参与研发,实习生挑大梁,实现技术突破。 36KR热点 2025年02月19日 16:31 0 点赞 0 评论 101 浏览
老兵”逐渐远去:英伟达将停止更新 Maxwell、Pascal、Volta 三架构 CUDA 支持 本文从个人视角出发,回顾了英伟达Maxwell、Pascal和Volta三大老架构的历史贡献,并对其即将停止CUDA支持的消息进行了深入分析。 IT热点 2025年01月27日 15:00 0 点赞 0 评论 101 浏览
揭秘老黄演讲中的关键技术:PD分离,UCSD华人团队如何让LLM吞吐量跃升4倍 老黄在GTC大会上的演讲引发了广泛关注,其中提到的PD分离技术成为焦点。本文详细解读了这项技术的原理及其背后的UCSD华人团队研究成果,揭示了其如何让LLM吞吐量跃升4倍。 36KR热点 2025年03月20日 13:17 0 点赞 0 评论 102 浏览
LSTM之父的惊人声明:1991年我就提出了线性自注意力机制,领先Transformer 26年 LSTM之父Jürgen在报告中指出,他在1991年就已经提出了线性自注意力机制,这一发现比Transformer早了26年。本文将带你深入了解这一惊人的历史,并探讨其对未来AI发展的影响。 36KR热点 2024年12月14日 10:26 0 点赞 0 评论 102 浏览
牛津教授的惊人预言:AI将超越人类科研速度500倍,真相究竟如何? 作为一名关注前沿科技动态的人,我最近了解到牛津大学一位教授提出了一个惊人的预言:未来十年内,AI可能完成相当于人类100年的科学发现,其科研效率更是超过了人类500倍。这让我深感震撼,同时也引发了我对AI未来发展潜力及其可能带来影响的思考。 36KR热点 2025年03月26日 21:46 0 点赞 0 评论 103 浏览
DeepSeek V3.1 Base突袭上线,实力碾压Claude 4,全网期待R2和V4 DeepSeek V3.1 Base突袭上线,成功击败Claude 4。文中详细阐述了不同模型的性能提升情况,分析了DeepSeek在市场中的影响力及竞争局势,并探讨了其技术基础、硬件支持以及未来的展望。 36KR热点 2025年08月20日 18:30 0 点赞 0 评论 104 浏览
AI教父Hinton怒批万斯:无知的干预或让全人类付出代价 AI教父Geoffrey Hinton在法国人工智能峰会上怒批美国副总统万斯,指责其对AI发展缺乏深刻理解。文章探讨了AI治理的重要性以及全球在此议题上的分歧。 36KR热点 2025年02月18日 01:07 0 点赞 0 评论 104 浏览
博弈论入门:当博弈论遇上机器学习 本文从个人视角出发,探讨了博弈论与机器学习的结合,介绍了博弈论在支持向量机(SVM)、生成对抗网络(GAN)和强化学习中的应用,并展望了未来的发展方向。 简书热点 2024年12月04日 02:20 0 点赞 0 评论 104 浏览
从迷茫到觉醒:他在《认知觉醒》中找到的灵感与成长 本文以个人视角讲述了如何通过阅读《认知觉醒》实现自我认知的提升,从核心理念到实际应用,详细记录了一个人从迷茫到觉醒的心路历程。 简书热点 2025年03月18日 22:28 0 点赞 0 评论 105 浏览
刘永好谈DeepSeek:小团队大能量,160人如何撬动AI行业? 新希望集团创始人刘永好在公开场合分享了AI公司DeepSeek的成功秘诀,揭示了其160人团队如何在行业内崭露头角。本文从团队规模、专注力及开放合作等角度深入探讨了DeepSeek崛起的原因,同时展望了其未来发展潜力。 百度热点 2025年03月01日 03:37 0 点赞 0 评论 105 浏览