深度学习

Meta Llama 4震撼登场:参数减半性能翻倍,大模型时代新篇章

作为一名亲历者,他目睹了Llama 4系列的发布过程。从Scout到Maverick再到即将面世的Behemoth,每一款模型都代表着大模型技术的重大突破。尤其是参数减半却性能翻倍的设计理念,以及对H100 GPU的支持,让开发者们看到了更多可能性。同时,DeepSeek的‘代码开源周’也为行业注入了新的活力。

2025年AI大模型谁能笑到最后?

作为一名关注AI发展的观察者,他见证了2025年AI大模型领域的激烈竞争。中美顶级AI模型的性能差距缩小到0.3%,中国企业如字节跳动、百度智能云等在AI Agent智能体商业化方面取得显著进展。同时,他也注意到生成式AI的技术天花板以及多模态大模型向世界模型迈进的趋势。

DeepSeek-V3模型小版本升级,体验AI技术的全新突破

作为一名关注AI技术发展的从业者,我亲身体验了DeepSeek-V3模型的小版本升级带来的变化。从海光信息技术团队的成功适配到华为云昇腾云服务的全栈优化,再到众多云计算厂商的支持,DeepSeek正在以惊人的速度改变着我们的生活和工作方式。