DeepSeek再放大招!V3/R1训练细节全面揭秘 在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。 36KR热点 2025年09月01日 23:40 0 点赞 0 评论 65 浏览
黄仁勋与梁文锋的深度对话:下一代芯片设计的关键 黄仁勋与梁文锋在北京进行了一次深度会谈,讨论了如何为中国设计下一代芯片的问题。这次会谈不仅涉及技术层面的挑战,还关注了中美双方的监管要求。通过这次合作,双方希望推动AI芯片行业的发展,并为全球客户提供更优质的产品。 头条热点 2025年04月17日 20:36 0 点赞 0 评论 65 浏览
女生借助DeepSeek提示找回丢失金项链的奇妙经历 本文讲述了女生如何借助DeepSeek这款人工智能工具找回丢失金项链的真实故事,同时探讨了DeepSeek在日常生活中的广泛应用及其潜在风险。 头条热点 2025年03月07日 15:38 0 点赞 0 评论 65 浏览
DeepSeek 认为最难学的语言,居然是它?网友:完全没想到! 近期微博热门话题“DeepSeek认为最难学的语言”引发广泛讨论,网友纷纷表示意外。本文结合技术背景与用户反馈,解析AI眼中语言学习的真实难度,并探讨中文为何未上榜。 微博热点 2025年05月08日 13:41 0 点赞 0 评论 65 浏览
DeepSeek横空出世,中国AI大厂的牌桌被彻底掀翻了? 2025年初,DeepSeek凭借其高性能、低价格的R1模型迅速走红,引发中国AI行业震荡。多家互联网大厂被迫调整战略,微软也将其整合进Azure。文章以个人视角讲述DeepSeek如何颠覆传统AI格局。 36KR热点 2025年05月20日 18:17 0 点赞 0 评论 65 浏览
DeepSeek中缅语言翻译系统:7小时奇迹助力缅甸地震救援 在缅甸中部地震救援中,DeepSeek仅用7小时开发出一套中缅英互译系统,解决了语言障碍问题,目前已帮助700余名救援人员和灾民。这项技术突破展现了AI在紧急情况下的巨大潜力。 简书热点 2025年04月09日 11:43 0 点赞 0 评论 65 浏览
刚出炉!DeepSeek新模型开源,五大能力大变革,我的一手体验 讲述了DeepSeek新模型开源的相关情况,详细介绍了该模型在多模态信息检索与生成、浏览器智能体任务、对话内容生成分享图功能、模型性能优化以及对齐海外顶尖模型技术等方面的五大能力变化,并分享了自己的使用体验。 36KR热点 2025年08月20日 10:46 0 点赞 0 评论 64 浏览
李彦宏开卷:DeepSeek慢且贵背后的真相与机遇 作为一名技术爱好者,我深入探讨了DeepSeek为何被称为“慢且贵”,并分析了百度及其他大厂针对这一问题所采取的策略。同时,我还对未来AI技术的发展趋势进行了展望。 36KR热点 2025年04月26日 09:17 0 点赞 0 评论 64 浏览
DeepSeek V3.1 极字bug官方已回应,开发者们别慌! 近日DeepSeek V3.1出现生成文本时插入‘极’等相关token的bug,开源社区用户给出多种复现场景,官方已对此作出回应。 IT热点 2025年08月27日 21:57 0 点赞 0 评论 64 浏览
那个总站在大模型C位的传奇男子:从DeepSeek到技术信仰的破圈之路 本文聚焦于AI领域那位始终站在大模型技术C位的传奇男子,从DeepSeek的爆红到Kimi长文本能力的突破,再到GShard与Switch Transformer的技术革新,揭示其背后的技术信仰与未来布局。 36KR热点 2025年05月11日 13:10 0 点赞 0 评论 64 浏览