体验新版GPT-4o后,我为何要感谢DeepSeek? 本文以第一人称视角详细记录了作者对新版GPT-4o的使用体验,并探讨了OpenAI在成人内容政策上的调整。同时,文章表达了对DeepSeek公司的感谢,强调其在AI领域的独特贡献。 36KR热点 2025年02月19日 19:42 0 点赞 0 评论 76 浏览
DeepSeek V3.1 Base突袭上线,实力碾压Claude 4,全网期待R2和V4 DeepSeek V3.1 Base突袭上线,成功击败Claude 4。文中详细阐述了不同模型的性能提升情况,分析了DeepSeek在市场中的影响力及竞争局势,并探讨了其技术基础、硬件支持以及未来的展望。 36KR热点 2025年08月20日 18:30 0 点赞 0 评论 76 浏览
满血版DeepSeek R1模型本地运行测试:M3 Ultra vs M4 Max 本文详细探讨了满血版DeepSeek R1模型在苹果M3 Ultra和M4 Max上的运行表现,分析了两者之间的性能差异,并讨论了使用苹果设备进行此类任务的成本效益。 36KR热点 2025年03月15日 01:51 0 点赞 0 评论 75 浏览
DeepSeek NSA技术:低成本高效率的AI推理革命 DeepSeek推出的NSA技术是一种硬件对齐且原生可训练的稀疏注意力机制,专为超快速长上下文训练与推理设计。该技术通过动态分层稀疏策略、粗粒度token压缩和细粒度token选择等核心组件,在降低成本的同时保持高性能,为AI领域带来了一场真正的降本增效革命。 IT热点 2025年02月19日 05:23 0 点赞 0 评论 75 浏览
古董GPU也能跑DeepSeek同款GRPO,显存只需1/10,上下文爆涨10倍! 文章探讨了如何通过优化GRPO算法,让老旧GPU也能高效运行DeepSeek同款模型,显存需求仅为原来的1/10,上下文长度提升10倍,极大降低了AI开发门槛。 36KR热点 2025年03月11日 12:50 0 点赞 0 评论 75 浏览
大模型的未来:GPT-4.5是否真的触及天花板? 本文从小李的角度出发,深入探讨了GPT-4.5未能带来震撼表现的原因,并分析了大模型发展是否进入瓶颈期以及非推理模型的潜在突破方向。文章结合技术细节和未来趋势,为读者提供了全面的视角。 知乎热点 2025年03月01日 12:36 0 点赞 0 评论 75 浏览
DeepSeek高薪招聘研究员:年薪120万,我能否成为其中一员? DeepSeek以120万年薪招聘AGI深度学习研究员的消息引发广泛关注。本文从个人视角出发,探讨了DeepSeek的招聘需求、岗位要求及如何准备应对挑战,为有志于进入AI领域的求职者提供参考。 百度热点 2025年02月15日 23:52 0 点赞 0 评论 75 浏览
DeepSeek R2模型或将提前发布,AI领域迎来新突破 DeepSeek正在加速推出其R2人工智能模型,原计划五月份发布,现努力提前推出。新模型有望生成更高质量代码,提升语言处理能力,成为AI领域的重要突破。 IT热点 2025年02月26日 14:33 0 点赞 0 评论 75 浏览
探索GPU并行计算的奥秘:从新手到专家 本文以个人视角深入浅出地介绍了GPU是如何实现并行计算的,涵盖了基本原理、实际应用案例以及未来展望等内容。 知乎热点 2025年01月09日 01:35 0 点赞 0 评论 74 浏览
直逼DeepSeek-R1-32B,碾压李飞飞s1-32B:UC伯克利等开源全新SOTA推理模型 本文详细介绍了由斯坦福、UC伯克利等机构联合发布的全新开源推理模型OpenThinker-32B,分析了其性能优势和技术特点,并探讨了其在实际应用中的潜力及未来发展方向。 36KR热点 2025年02月14日 12:52 0 点赞 0 评论 74 浏览