黄仁勋亲口承认：华为昇腾384超节点技术已超越英伟达！DeepSeek跑出惊人效率

99 阅读 0 评论 0 点赞 AI原创

导读： 华为AI超节点技术揭秘｜黄仁勋的意外评价｜DeepSeek实测表现｜未来算力格局将变？

华为AI超节点技术，到底有多强？

在2025年4月，华为正式宣布其昇腾CloudMatrix 384超节点技术实现重大突破。这项技术基于国产昇腾芯片构建，采用大规模分布式架构，将384张昇腾AI加速卡连接成一个高效协同的“超级计算机”。

这并非简单的堆砌硬件，而是系统级的创新。从算力规模、训练推理效率到系统稳定性，华为都实现了显著提升。据内部测试数据显示，在运行大型AI模型时，昇腾384超节点的整体性能甚至超过了英伟达NVL72系统。

这一技术突破引起了全球AI行业的高度关注。作为GPU领域的霸主，英伟达CEO黄仁勋在近期一次公开演讲中罕见地对华为的技术表示了认可。

“从技术参数看，华为的CloudMatrix 384超节点，性能上超越了英伟达。”

这句话出自一向自信满满的黄仁勋之口，无疑让整个行业为之一震。他进一步指出，华为不仅在单个芯片性能上逼近甚至超过H200系列，在整体系统的扩展性和能效比方面也展现出了独特优势。

为了验证昇腾384的实际性能，硅基流动与华为云合作上线了基于该平台的DeepSeek-R1服务。这套系统结合了华为的高性能推理框架SiliconLLM，采用了大规模专家并行技术。

实际测试结果显示，在保证单用户20 TPS（每秒请求数）的前提下，DeepSeek-R1在昇腾384平台上展现出惊人的效率。相比传统方案，推理速度提升了近3倍，同时能耗降低了30%以上。

这种高效的背后，离不开昇腾910C的强大支持。这款芯片作为昇腾系列的新一代主力产品，其单芯片算力达到了256 TFLOPS，已经明显优于英伟达A100的表现。

随着昇腾384超节点的陆续交付，越来越多的头部客户开始部署这一新平台。从大模型训练到实时推理，华为昇腾正在逐步构建起完整的AI生态体系。

而这一切，也让原本由英伟达主导的AI算力市场格局开始出现松动。尤其是在中国本土市场，华为昇腾凭借自主可控的优势和不断优化的软硬件协同能力，正赢得越来越多开发者的青睐。

可以预见的是，未来的AI竞赛，将不再只是GPU之间的较量，而是一场系统级创新能力的全面比拼。在这条赛道上，华为显然已经迈出了关键一步。