低成本高效率:李飞飞团队用不到50美元训练新模型,AI领域迎来革命性突破 李飞飞教授带领团队用不到50美元成功训练出一款性能卓越的新模型,采用最简化的测试时间扩展方法,仅需让模型训练约1000个问题,即可获得超越传统模型的强大推理能力。 头条热点 2025年02月07日 02:36 0 点赞 0 评论 53 浏览
DeepSeek再放大招!V3/R1训练细节全面揭秘 在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。 36KR热点 2025年09月01日 23:40 0 点赞 0 评论 33 浏览