DeepSeek

DeepSeek再放大招!V3/R1训练细节全面揭秘

在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。

黄仁勋与梁文锋的深度对话:下一代芯片设计的关键

黄仁勋与梁文锋在北京进行了一次深度会谈,讨论了如何为中国设计下一代芯片的问题。这次会谈不仅涉及技术层面的挑战,还关注了中美双方的监管要求。通过这次合作,双方希望推动AI芯片行业的发展,并为全球客户提供更优质的产品。

梁文锋与杨植麟同日发论文“撞车”!AI模型之战再掀高潮

2025年2月18日,DeepSeek创始人梁文锋与月之暗面创始人杨植麟几乎同时发布关于Transformer注意力机制优化的新论文,引发业界广泛关注。文章从事件回顾、技术路线对比、创始人背景及未来趋势四个角度深入解析这场AI领域的‘正面交锋’。

DeepSeek崛起:中国AI的全球突围战

本文深入探讨了中国DeepSeek公司在人工智能领域的重大突破及其全球影响,分析了其成功背后的创新理念与国际反响,同时展望了未来发展的无限可能。

被问是否用过DeepSeek?库克的回答亮了!

作为一名对人工智能感兴趣的探索者,我深入研究了DeepSeek这款由中国团队开发的AI模型。通过分析苹果CEO库克对其的高度评价以及DeepSeek所面临的国际挑战,我发现这款模型不仅是技术突破的象征,更是全球化背景下科技合作与竞争的真实写照。

后DeepSeek时代,AI如何重塑千行百业?

作为一名亲历者,我在36氪主办的2025 AI Partner大会上见证了AI应用对各行业的深刻影响。从DeepSeek的崛起,到Super App的出现,AI正以前所未有的速度改变着我们的生活和工作方式。