Meta KernelLLM爆冷登场:8B参数模型竟敢叫板GPT-4o? Meta最新推出的KernelLLM模型以80亿参数挑战GPT-4o,凭借出色的推理能力和低部署成本引发热议。文章从技术原理、性能对比、硬件适配等多个角度深入解读这一突破性进展。 36KR热点 2025年05月28日 10:42 0 点赞 0 评论 54 浏览
梁文锋督战!DeepSeek新模型欲与OpenAI抗衡 中国AI公司DeepSeek正在研发新AI模型,该模型具备更先进AI智能体功能,将与OpenAI等美国企业在新兴技术领域展开竞争。创始人梁文锋亲自督战,计划今年第四季度发布新软件。 36KR热点 2025年09月06日 18:26 0 点赞 0 评论 68 浏览
微软CEO纳德拉盛赞DeepSeek:计算效率极高的开源模型 文章详细介绍了微软CEO纳德拉对DeepSeek的高度评价,探讨了DeepSeek在计算效率和开源模式上的优势及其对未来AI产业的影响。 IT热点 2025年01月28日 18:55 0 点赞 0 评论 100 浏览
英伟达开源新王登顶!14万H100小时训练细节曝光,DeepSeek-R1再掀AI风暴 英伟达开源新模型 Perception-R1,采用 GRPO 强化学习技术,挑战 DeepSeek-R1 霸主地位。文章深入解析训练细节、成本构成及开源竞争格局。 36KR热点 2025年05月06日 21:51 0 点赞 0 评论 80 浏览
DeepSeek深陷困境,腾讯系产品受波及! DeepSeek用户使用率半年内暴跌94%,从50%降至3%,官网流量下滑超70%。其核心模型R1使用率也大幅下降,而ChatGPT和谷歌Gemini使用率猛增。元宝因与DeepSeek深度绑定受影响,两者日下载量均下滑。腾讯内部曾针对元宝提出改进意见并采取措施,但仍难掩DeepSeek的问题。 腾讯热点 2025年07月13日 05:16 0 点赞 0 评论 72 浏览
DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布 作为一名关注科技发展的个人,我目睹了DeepSeek R2的提前发布及其带来的巨大影响。从刘慈欣对未来科幻创作的思考,到中美之间围绕AI技术展开的竞争,再到全新推理时Scaling论文的发布,每一个细节都让我感受到人工智能领域的快速进步。在这篇文章中,我将带你深入了解DeepSeek R2背后的故事以及它可能带来的改变。 36KR热点 2025年04月04日 21:45 0 点赞 0 评论 83 浏览