中国大模型密集开源:一场AI行业的“安卓时刻” 作为一名关注AI领域的观察者,我发现中国大模型开源热潮正在深刻改变整个行业。从DeepSeek到阿里巴巴、百度和腾讯,这些企业的开源举措不仅降低了技术门槛,还推动了AI技术在各行业的广泛应用。然而,我们也需要正视其中存在的风险与挑战。 百度热点 2025年03月26日 13:25 0 点赞 0 评论 53 浏览
直逼DeepSeek-R1-32B,碾压李飞飞s1-32B:UC伯克利等开源全新SOTA推理模型 本文详细介绍了由斯坦福、UC伯克利等机构联合发布的全新开源推理模型OpenThinker-32B,分析了其性能优势和技术特点,并探讨了其在实际应用中的潜力及未来发展方向。 36KR热点 2025年02月14日 12:52 0 点赞 0 评论 62 浏览
MiniMax开源M1推理模型,456B参数碾压DeepSeek-R1?技术细节曝光 MiniMax发布并开源首个大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1,支持100万token上下文输入,训练成本仅53万美元。 36KR热点 2025年06月18日 11:23 0 点赞 0 评论 45 浏览
深度解析Meta发布的Llama 4大模型:技术革新与未来展望 作为一名AI行业的观察者,他深入分析了Meta发布的Llama 4大模型。从技术革新到商业化探索,再到未来展望,他揭示了这款模型的潜力与挑战。他认为Llama 4虽然在某些方面存在不足,但其技术创新和商业化策略为未来发展提供了广阔空间。 知乎热点 2025年04月06日 12:42 0 点赞 0 评论 41 浏览
OpenAI被DeepSeek逼到墙角?一场AI领域的无声较量 本文探讨了全球AI领域因DeepSeek崛起而引发的竞争格局变化,分析了OpenAI与DeepSeek在技术、成本及市场策略上的差异,并展望了未来AI行业的发展趋势。 贴吧热点 2025年02月16日 17:41 0 点赞 0 评论 55 浏览
震惊!谷歌开源史上最小Gemma 3,手机轻松运行,超省电 昨天,谷歌发布了史上最小的Gemma 3开源模型,仅有2.7亿个参数。它以特定任务微调为目标,具备强大指令跟踪和文本能力,在手机上能轻松运行,进行25次对话耗电不到1%,非常省电。 36KR热点 2025年08月16日 16:20 0 点赞 0 评论 30 浏览
Meta发布Llama 4,实际体验如何? 作为一名开发者,他深入体验了Meta最新发布的Llama 4大语言模型。从MOE架构的应用到实际操作中的优缺点,再到对未来发展的展望,他的分享为我们揭示了这款开源模型的真实面貌。 知乎热点 2025年04月06日 13:37 0 点赞 0 评论 45 浏览
第一批DeepSeek开发者为何开始逃离? 本文深入探讨了DeepSeek首批开发者选择离开的原因,分析了其背后的行业现状及未来发展方向。通过罗福莉等开发者的经历,揭示了开源大模型在商业化道路上面临的困境与机遇。 36KR热点 2025年02月19日 22:42 0 点赞 0 评论 68 浏览
DeepSeek再放大招!V3/R1训练细节全面揭秘 在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。 36KR热点 2025年09月01日 23:40 0 点赞 0 评论 35 浏览
DeepSeek推翻两座大山:中国AI创业公司如何以极低成本实现技术突破 文章介绍了中国AI创业公司DeepSeek如何通过创新和技术突破,在全球范围内引发广泛关注,并探讨了其对未来AI领域的影响。 头条热点 2025年01月28日 03:05 0 点赞 0 评论 69 浏览