高效AI

DeepSeek再放大招!V3/R1训练细节全面揭秘

在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。

张林峰:用科研成果书写青春华章

27岁的清华博士张林峰已成为上海交通大学助理教授和博导,他专注于高效人工智能的研究,将知识蒸馏与模型压缩技术应用于多个领域,推动了行业的发展。他坚信AI for Science将成为科技发展的新引擎,并致力于构建平台化科研体系。