DeepSeek再放大招!V3/R1训练细节全面揭秘 在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。 36KR热点 2025年09月01日 23:40 0 点赞 0 评论 33 浏览
DeepSeek删豆包,大模型世子之争的惊人转折 在大模型领域,六小虎面临巨大挑战,DeepSeek删豆包引发热议。DeepSeek神秘又充满冲击力,豆包不断发展却遇难题。市场多方角逐,未来竞争激烈。 36KR热点 2025年08月22日 08:50 0 点赞 0 评论 33 浏览
半年不到,DeepSeek竟跌落神坛?用户流向大揭秘 半年不到,DeepSeek就跌落神坛了,很多人好奇它的用户去向。原来不少用户转去了第三方平台,官方虽难维系增长,但第三方使用量猛增。5月DeepSeek移动端月活跃用户减少2500万,但仍居榜首,领先华为小艺不多。DeepSeek模型被多家企业集成,第三方平台token吞吐量大提升。 腾讯热点 2025年07月24日 09:51 0 点赞 0 评论 33 浏览
DeepSeek更新,国产芯片迎来重大利好! 最近DeepSeek更新到V3.1版,增加对FP8精度和国产芯片的支持,这对国产算力生态发展是个重大契机。同时,腾讯、华为昇腾芯片等方面也有积极动态,再加上股市上芯片概念股的亮眼表现,整体看国产芯片发展前景良好。 36KR热点 2025年08月25日 08:46 0 点赞 0 评论 33 浏览
揭秘DeepSeek提及的FP8:下一代国产芯片的秘密武器? 最近,DeepSeek在其最新版本DeepSeek - V3.1中提到的FP8引起了广泛关注。FP8是一种低精度数字格式,它在DeepSeek - V3的训练中被用于混合精度计算,能减少计算量和内存占用,加快训练速度并节省能源。FP8混合精度训练技术还有许多优势,如细粒度量化策略、低精度优化器状态等。这对DeepSeek的性能提升有很大帮助,也让我们对下一代国产芯片充满期待。 头条热点 2025年08月22日 16:07 0 点赞 0 评论 33 浏览
DeepSeek真的‘凉’了吗?市场遇冷的背后真相 DeepSeek在市场上似乎遇冷,但它真的是“凉”了吗?从市场表现、行业竞争、自身战略选择以及商业化探索等方面分析其现状及未来发展。 百度热点 2025年07月26日 19:05 0 点赞 0 评论 33 浏览
DeepSeek失开源首冠,Kimi K2接棒仍为中国力量 在IT界,DeepSeek失去开源首位宝座,但其继任者Kimi K2依旧来自中国。围绕Kimi K2架构存在质疑,团队回应确有继承。K2近期非常火热,中国在开源领域展现出强大实力,开源追赶闭源成趋势。 IT热点 2025年07月21日 08:16 0 点赞 0 评论 33 浏览
DeepSeek母公司员工套现上亿被抓,背后故事令人咋舌 讲述了DeepSeek母公司幻方量化员工套取上亿元被抓一事,从事件回顾、影响、与其他类似事件对比以及对行业的警示作用等方面进行了详细阐述,表达了对幻方量化未来的期望。 百度热点 2025年08月11日 08:06 0 点赞 0 评论 32 浏览
DeepSeek“崩了”引热议,百度如何回应这场AI风暴? DeepSeek近期多次出现服务异常,引发网友热议。百度作为国内AI巨头之一,如何看待DeepSeek带来的冲击?本文从宕机原因、行业影响、百度应对策略等多个角度深入解析。 百度热点 2025年05月13日 19:15 0 点赞 0 评论 32 浏览
那些离开DeepSeek的用户们都去哪儿了? 讲述了由于DeepSeek更新版本爽约、高幻觉率等问题,导致用户数据下滑,许多用户离开的现象,分析了其面临竞争对手压力和技术问题等情况,探讨了未来发展的方向。 百度热点 2025年08月05日 23:35 0 点赞 0 评论 32 浏览