DeepSeek再放大招!V3/R1训练细节全面揭秘 在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。 36KR热点 2025年09月01日 23:40 0 点赞 0 评论 65 浏览
黄仁勋与梁文锋的深度对话:下一代芯片设计的关键 黄仁勋与梁文锋在北京进行了一次深度会谈,讨论了如何为中国设计下一代芯片的问题。这次会谈不仅涉及技术层面的挑战,还关注了中美双方的监管要求。通过这次合作,双方希望推动AI芯片行业的发展,并为全球客户提供更优质的产品。 头条热点 2025年04月17日 20:36 0 点赞 0 评论 65 浏览
梁文锋与杨植麟同日发论文“撞车”!AI模型之战再掀高潮 2025年2月18日,DeepSeek创始人梁文锋与月之暗面创始人杨植麟几乎同时发布关于Transformer注意力机制优化的新论文,引发业界广泛关注。文章从事件回顾、技术路线对比、创始人背景及未来趋势四个角度深入解析这场AI领域的‘正面交锋’。 36KR热点 2025年05月05日 09:20 0 点赞 0 评论 66 浏览
DeepSeek赋能广东政务:广州、深圳率先接入,AI如何改变我们的生活? 文章详细介绍了DeepSeek在广东政务系统中的应用情况,包括广州、深圳等地的具体实践案例,以及基础电信运营商的接入进展。同时探讨了DeepSeek在医疗、海事等领域的广泛应用,并结合专家观点展望了其未来发展潜力。 腾讯热点 2025年02月16日 17:07 0 点赞 0 评论 66 浏览
实测DeepSeek-R1小版本更新:三大场景梳理模型升级点和缺陷 本文以第三人称视角实测DeepSeek-R1最新小版本更新,详细梳理推理能力、代码生成及中文写作三大场景的升级表现与现存缺陷。 36KR热点 2025年05月30日 12:31 0 点赞 0 评论 66 浏览
DeepSeek崛起:中国AI的全球突围战 本文深入探讨了中国DeepSeek公司在人工智能领域的重大突破及其全球影响,分析了其成功背后的创新理念与国际反响,同时展望了未来发展的无限可能。 百度热点 2025年03月07日 17:38 0 点赞 0 评论 66 浏览
被问是否用过DeepSeek?库克的回答亮了! 作为一名对人工智能感兴趣的探索者,我深入研究了DeepSeek这款由中国团队开发的AI模型。通过分析苹果CEO库克对其的高度评价以及DeepSeek所面临的国际挑战,我发现这款模型不仅是技术突破的象征,更是全球化背景下科技合作与竞争的真实写照。 腾讯热点 2025年03月23日 12:32 0 点赞 0 评论 66 浏览
后DeepSeek时代,AI如何重塑千行百业? 作为一名亲历者,我在36氪主办的2025 AI Partner大会上见证了AI应用对各行业的深刻影响。从DeepSeek的崛起,到Super App的出现,AI正以前所未有的速度改变着我们的生活和工作方式。 36KR热点 2025年04月23日 14:15 0 点赞 0 评论 66 浏览
DeepSeek:中国AI创新的崛起与全球竞争新格局 本文探讨了DeepSeek在中国AI产业发展中的重要地位及其对全球AI竞争格局的影响。通过分析DeepSeek的技术特点和市场反应,揭示了中国AI产业从‘跟随创新’到‘范式创新’的转变。 头条热点 2025年01月28日 02:05 0 点赞 0 评论 66 浏览
DeepSeek大模型商业揭秘:日赚346万元背后的故事 DeepSeek公布成本、收入和利润率数据,日均利润高达346万元。本文从成本控制、收入来源及未来挑战等方面全面解析这家AI企业的成功之道。 腾讯热点 2025年03月01日 18:55 0 点赞 0 评论 66 浏览