DeepSeek

DeepSeek再放大招!V3/R1训练细节全面揭秘

在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。

DeepSeek深陷困境,腾讯系产品受波及!

DeepSeek用户使用率半年内暴跌94%,从50%降至3%,官网流量下滑超70%。其核心模型R1使用率也大幅下降,而ChatGPT和谷歌Gemini使用率猛增。元宝因与DeepSeek深度绑定受影响,两者日下载量均下滑。腾讯内部曾针对元宝提出改进意见并采取措施,但仍难掩DeepSeek的问题。

惊!DeepSeek V3.1 出现‘极’字满屏乱蹦的诡异Bug

近期,DeepSeek V3.1 版本出现了一个让人啼笑皆非的Bug,某些输出token会被随机替换成「极」字,开发者对此十分困惑。这一现象引起了很多用户的关注,大家纷纷反馈相关问题,对正常使用造成了不小的影响。