DeepSeek

DeepSeek再放大招!V3/R1训练细节全面揭秘

在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。

DeepSeek-V3.1震撼发布!开启AI Agent新时代

8月19日,DeepSeek官方宣布线上模型版本已升级至V3.1。新版模型上下文长度拓展至128k,用户可通过官方网页、App和小程序进行测试,API接口调用方式保持不变。此次升级提升了模型的上下文容量,使其更好处理长文档分析等,还在编程等方面有显著提升。

那些离开DeepSeek的用户们都去哪儿了?

讲述了由于DeepSeek更新版本爽约、高幻觉率等问题,导致用户数据下滑,许多用户离开的现象,分析了其面临竞争对手压力和技术问题等情况,探讨了未来发展的方向。