大模型的未来:GPT-4.5是否真的触及天花板? 本文从小李的角度出发,深入探讨了GPT-4.5未能带来震撼表现的原因,并分析了大模型发展是否进入瓶颈期以及非推理模型的潜在突破方向。文章结合技术细节和未来趋势,为读者提供了全面的视角。 知乎热点 2025年03月01日 12:36 0 点赞 0 评论 75 浏览
满血版DeepSeek R1模型本地运行测试:M3 Ultra vs M4 Max 本文详细探讨了满血版DeepSeek R1模型在苹果M3 Ultra和M4 Max上的运行表现,分析了两者之间的性能差异,并讨论了使用苹果设备进行此类任务的成本效益。 36KR热点 2025年03月15日 01:51 0 点赞 0 评论 75 浏览
DeepSeek高薪招聘研究员:年薪120万,我能否成为其中一员? DeepSeek以120万年薪招聘AGI深度学习研究员的消息引发广泛关注。本文从个人视角出发,探讨了DeepSeek的招聘需求、岗位要求及如何准备应对挑战,为有志于进入AI领域的求职者提供参考。 百度热点 2025年02月15日 23:52 0 点赞 0 评论 75 浏览
DeepSeek R2模型或将提前发布,AI领域迎来新突破 DeepSeek正在加速推出其R2人工智能模型,原计划五月份发布,现努力提前推出。新模型有望生成更高质量代码,提升语言处理能力,成为AI领域的重要突破。 IT热点 2025年02月26日 14:33 0 点赞 0 评论 75 浏览
揭开DeepSeek的神秘面纱:中国AI的新突破 本文详细介绍了中国AI公司DeepSeek及其最新发布的DeepSeek-R1模型,探讨了该模型的技术亮点和社会影响,展示了中国在AI领域的创新能力和竞争实力。 微博热点 2025年01月28日 10:47 0 点赞 0 评论 76 浏览
深度解析DeepSeek新成果:实习生如何挑大梁,加速AI训练推理 DeepSeek团队发布新论文,介绍改进的稀疏注意力机制NSA,显著加速AI训练推理。梁文锋亲自参与研发,实习生挑大梁,实现技术突破。 36KR热点 2025年02月19日 16:31 0 点赞 0 评论 76 浏览
古董GPU也能跑DeepSeek同款GRPO,显存只需1/10,上下文爆涨10倍! 文章探讨了如何通过优化GRPO算法,让老旧GPU也能高效运行DeepSeek同款模型,显存需求仅为原来的1/10,上下文长度提升10倍,极大降低了AI开发门槛。 36KR热点 2025年03月11日 12:50 0 点赞 0 评论 76 浏览
体验新版GPT-4o后,我为何要感谢DeepSeek? 本文以第一人称视角详细记录了作者对新版GPT-4o的使用体验,并探讨了OpenAI在成人内容政策上的调整。同时,文章表达了对DeepSeek公司的感谢,强调其在AI领域的独特贡献。 36KR热点 2025年02月19日 19:42 0 点赞 0 评论 76 浏览
浙大校友革新Transformer,多token注意力让LLM错误率归零! 作为一名技术爱好者,他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能,还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势,他看到了这项技术在未来AI领域的巨大潜力。 36KR热点 2025年04月04日 08:47 0 点赞 0 评论 77 浏览
新王诞生:DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史 DeepSeek双模型GitHub Star数首次超越OpenAI,成为大模型领域新标杆。本文深入分析DeepSeek的技术创新、低成本策略及对行业的深远影响,探讨开源模式如何改变AI发展轨迹。 IT热点 2025年02月08日 00:01 0 点赞 0 评论 77 浏览