开源模型

DeepSeek再放大招!V3/R1训练细节全面揭秘

在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。

OpenAI开源大模型来了!轻量版Deep Research免费可用

作为一名热爱技术的探索者,他深入研究了OpenAI最新发布的开源大模型及其轻量版Deep Research。从图像生成到开源模型,再到免费使用的轻量版,每一项技术都展现了OpenAI对未来AI发展的深刻理解与战略布局。

Meta发布Llama 4,实际体验如何?

作为一名开发者,他深入体验了Meta最新发布的Llama 4大语言模型。从MOE架构的应用到实际操作中的优缺点,再到对未来发展的展望,他的分享为我们揭示了这款开源模型的真实面貌。

深度解析Meta发布的Llama 4大模型:技术革新与未来展望

作为一名AI行业的观察者,他深入分析了Meta发布的Llama 4大模型。从技术革新到商业化探索,再到未来展望,他揭示了这款模型的潜力与挑战。他认为Llama 4虽然在某些方面存在不足,但其技术创新和商业化策略为未来发展提供了广阔空间。

中国大模型密集开源:一场AI行业的“安卓时刻”

作为一名关注AI领域的观察者,我发现中国大模型开源热潮正在深刻改变整个行业。从DeepSeek到阿里巴巴、百度和腾讯,这些企业的开源举措不仅降低了技术门槛,还推动了AI技术在各行业的广泛应用。然而,我们也需要正视其中存在的风险与挑战。