股指量化策略的奥秘:从数据到财富 本文以个人视角深入探讨股指量化策略的核心思路,涵盖多因子模型、套利策略、机器学习等关键内容,帮助读者全面了解量化投资的魅力。 简书热点 2025年02月20日 23:06 0 点赞 0 评论 75 浏览
直逼DeepSeek-R1-32B,碾压李飞飞s1-32B:UC伯克利等开源全新SOTA推理模型 本文详细介绍了由斯坦福、UC伯克利等机构联合发布的全新开源推理模型OpenThinker-32B,分析了其性能优势和技术特点,并探讨了其在实际应用中的潜力及未来发展方向。 36KR热点 2025年02月14日 12:52 0 点赞 0 评论 75 浏览
DeepSeek NSA技术:低成本高效率的AI推理革命 DeepSeek推出的NSA技术是一种硬件对齐且原生可训练的稀疏注意力机制,专为超快速长上下文训练与推理设计。该技术通过动态分层稀疏策略、粗粒度token压缩和细粒度token选择等核心组件,在降低成本的同时保持高性能,为AI领域带来了一场真正的降本增效革命。 IT热点 2025年02月19日 05:23 0 点赞 0 评论 75 浏览
OpenAI发布三大新模型,构建未来AI Agent的基石 OpenAI一次性发布三个新模型,涵盖GPT-4.5、Assistants API升级计划及全新Agent开发工具,标志着AI Agent开发进入新阶段。 36KR热点 2025年03月21日 10:52 0 点赞 0 评论 76 浏览
DeepSeek-R1 持续刷屏,连 Open R1 都来了!抱抱脸发起,1 天狂揽 1.9k 星 DeepSeek-R1 开源大模型在 GitHub 上一夜走红,1 天内获得 1.9k 标星。该模型不仅在多项基准测试中表现出色,还在开源社区中掀起了巨大波澜。 IT热点 2025年01月27日 13:10 0 点赞 0 评论 76 浏览
深度解析DeepSeek新成果:实习生如何挑大梁,加速AI训练推理 DeepSeek团队发布新论文,介绍改进的稀疏注意力机制NSA,显著加速AI训练推理。梁文锋亲自参与研发,实习生挑大梁,实现技术突破。 36KR热点 2025年02月19日 16:31 0 点赞 0 评论 76 浏览
古董GPU也能跑DeepSeek同款GRPO,显存只需1/10,上下文爆涨10倍! 文章探讨了如何通过优化GRPO算法,让老旧GPU也能高效运行DeepSeek同款模型,显存需求仅为原来的1/10,上下文长度提升10倍,极大降低了AI开发门槛。 36KR热点 2025年03月11日 12:50 0 点赞 0 评论 76 浏览
这个Notebook集合,真的赞! 作为一名数据科学爱好者,我发现了一个非常有用的技巧,能够在Jupyter Notebook中轻松切换Anaconda中的定制环境,而不需要重启Notebook。这篇文章详细介绍了如何实现这一功能,并分享了我的实际应用体验。 简书热点 2024年12月05日 16:22 0 点赞 0 评论 77 浏览
GPT-4o引爆吉卜力风潮:大模型能力进化是否让SD和Prompt白学了? 作为一名关注AI发展的个人,他深入探讨了GPT-4o的多模态处理能力及其引发的技术革命。通过分析GPT-4o与Stable Diffusion的差异,以及数据隐私问题,展示了大模型能力进化的深远影响。 36KR热点 2025年03月29日 10:37 0 点赞 0 评论 78 浏览
马斯克Grok3发布,AI大模型格局将如何重塑? 马斯克发布的Grok 3大模型引发热议,本文从技术特点、竞争对手对比以及行业影响等多个角度深入探讨了这款新模型的意义,并对未来AI大模型的发展趋势进行了展望。 知乎热点 2025年02月19日 11:46 0 点赞 0 评论 78 浏览