古董GPU也能跑DeepSeek同款GRPO,显存只需1/10,上下文爆涨10倍! 文章探讨了如何通过优化GRPO算法,让老旧GPU也能高效运行DeepSeek同款模型,显存需求仅为原来的1/10,上下文长度提升10倍,极大降低了AI开发门槛。 36KR热点 2025年03月11日 12:50 0 点赞 0 评论 95 浏览
全球华人见证AI巅峰对决:Grok 3险胜DeepSeek,马斯克再创奇迹 本文详细介绍了马斯克旗下xAI公司推出的Grok 3大模型在全球范围内的表现及其与DeepSeek、OpenAI等竞争对手之间的激烈角逐。通过深入分析各模型的技术特点和发展趋势,探讨了未来AI领域的潜在发展方向。 36KR热点 2025年02月19日 17:30 0 点赞 0 评论 95 浏览
深度揭秘:DeepSeek的盈利密码,日赚346万的秘密竟是这样! 本文深入剖析了DeepSeek公司的盈利模式,详细解读其成本结构、收入来源及利润率,并对未来发展前景进行了展望。通过第一人称视角的叙述方式,带领读者全面了解这家日赚346万的AI巨头。 36KR热点 2025年03月01日 21:35 0 点赞 0 评论 94 浏览
GPT-4o引爆吉卜力风潮:大模型能力进化是否让SD和Prompt白学了? 作为一名关注AI发展的个人,他深入探讨了GPT-4o的多模态处理能力及其引发的技术革命。通过分析GPT-4o与Stable Diffusion的差异,以及数据隐私问题,展示了大模型能力进化的深远影响。 36KR热点 2025年03月29日 10:37 0 点赞 0 评论 94 浏览
Claude解锁实时搜索功能,Anthropic能否逆袭OpenAI与谷歌? Claude新增实时网络搜索功能,让其从数据截止限制中解放出来。本文从Dario Amodei离开OpenAI的原因切入,深入探讨Claude此次升级的意义及其对未来AI市场竞争格局的影响。 36KR热点 2025年03月22日 09:45 0 点赞 0 评论 94 浏览
机器学习中那些简单却巧妙的idea 本文从个人视角出发,分享了机器学习中一些简单却巧妙的idea,包括卷积神经网络的局部连接特性、决策树的优化技巧、K-均值聚类的实现、线性回归的应用以及特征选择的方法。 知乎热点 2024年11月26日 22:36 0 点赞 0 评论 94 浏览
2025,AI搜索要搞大事情 本文从个人视角出发,讲述了2025年AI搜索领域的重大变革及其对日常生活的影响,探讨了技术进步背后的社会责任。 36KR热点 2025年01月11日 17:36 0 点赞 0 评论 94 浏览
DeepSeek NSA技术:低成本高效率的AI推理革命 DeepSeek推出的NSA技术是一种硬件对齐且原生可训练的稀疏注意力机制,专为超快速长上下文训练与推理设计。该技术通过动态分层稀疏策略、粗粒度token压缩和细粒度token选择等核心组件,在降低成本的同时保持高性能,为AI领域带来了一场真正的降本增效革命。 IT热点 2025年02月19日 05:23 0 点赞 0 评论 93 浏览
深度解析DeepSeek的成本秘密:为何能将大模型训练成本压缩到极致? 本文从个人视角出发,详细解析了DeepSeek在AI模型训练中的成本计算逻辑,探讨其如何通过技术创新实现低成本高效率,并对比分析了与其他行业巨头的差距,揭示了低成本AI的未来发展方向。 36KR热点 2025年02月19日 17:31 0 点赞 0 评论 93 浏览
马斯克Grok3发布,AI大模型格局将如何重塑? 马斯克发布的Grok 3大模型引发热议,本文从技术特点、竞争对手对比以及行业影响等多个角度深入探讨了这款新模型的意义,并对未来AI大模型的发展趋势进行了展望。 知乎热点 2025年02月19日 11:46 0 点赞 0 评论 93 浏览