DeepSeek

揭秘DeepSeek提及的FP8:下一代国产芯片的秘密武器?

最近,DeepSeek在其最新版本DeepSeek - V3.1中提到的FP8引起了广泛关注。FP8是一种低精度数字格式,它在DeepSeek - V3的训练中被用于混合精度计算,能减少计算量和内存占用,加快训练速度并节省能源。FP8混合精度训练技术还有许多优势,如细粒度量化策略、低精度优化器状态等。这对DeepSeek的性能提升有很大帮助,也让我们对下一代国产芯片充满期待。

DeepSeek失开源首冠,Kimi K2接棒仍为中国力量

在IT界,DeepSeek失去开源首位宝座,但其继任者Kimi K2依旧来自中国。围绕Kimi K2架构存在质疑,团队回应确有继承。K2近期非常火热,中国在开源领域展现出强大实力,开源追赶闭源成趋势。

宇树机器人欲上市,DeepSeek为何渐失光彩?

宇树机器人准备上市,DeepSeek却慢慢转淡,背后原因何在?宇树凭借四足机器人优势进军人形机器人领域并筹备上市,DeepSeek作为独立原生App在插件形态主导市场下失去竞争力,且技术更新缓慢,面临诸多挑战。

王树国三问中国教育:如果梁文锋读博还有DeepSeek吗?

福耀科技大学校长王树国在科技论坛上提出三个关于中国教育体系的核心问题,引发广泛讨论。文章围绕梁文锋等科技创业者是否适合继续读博展开分析,探讨学历与创新能力的关系、教育理念是否滞后于时代发展以及如何打破学科壁垒进行教育改革。

DeepSeek再放大招!V3/R1训练细节全面揭秘

在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。

DeepSeek:AI领域的革新者,微博热搜背后的真相

在微博热搜‘DeepSeek演都不演了’的背后,隐藏着许多故事。这篇文章深入探讨了DeepSeek在AI领域的变革意义,它引发的各种争议,以及在微博等社交平台上的影响力。通过详细阐述,让大家更好地了解这个神秘的存在。