坚持不做Sora，百度为何又开始重视多模态大模型？

67 阅读 0 评论 0 点赞 AI原创

导读：引言｜Sora的冲击与百度的选择｜多模态：百度的新战场｜战略布局背后的技术逻辑｜挑战与质疑｜未来展望

引言：AI浪潮下的“变与不变”

在AI大模型的竞赛中，技术路线之争从未停歇。而在这场全球瞩目的角逐中，百度却始终保持着一份独特的定力——它没有盲目追随OpenAI的脚步去开发类似Sora的视频生成模型，而是将重心放在了多模态大模型的打磨上。

有人质疑这是“慢半拍”，也有人认为是“另辟蹊径”。但随着文心大模型4.5 Turbo、X1 Turbo等新版本的发布，百度似乎正在用技术实力回应外界的疑问。

Sora的冲击与百度的选择

当Sora横空出世时，整个AI圈为之震动。其强大的视频生成能力不仅让内容创作者看到了无限可能，也让各大科技巨头重新审视自己的产品布局。

“我们不是不看好视频生成，只是更相信多模态才是未来的方向。”一位接近百度AI团队的人士曾这样说道。

这句话或许道出了百度的战略思路。在他们看来，Sora虽然惊艳，但更多是一个垂直领域的突破，而多模态才是通往通用人工智能（AGI）的关键路径。

多模态：百度的新战场

2025年，百度发布了文心大模型4.5 Turbo和深度思考模型X1 Turbo，这两款产品都强调了对文本、图像、视频等多模态数据的融合处理能力。

从官方数据来看，文心4.5 Turbo的学习效率提升了近2倍，多模态理解效果提升超过30%。这意味着，在处理复杂任务时，比如数字人交互、跨模态检索、图文生成视频等场景下，模型表现会更加稳定和高效。

这种能力的背后，是百度多年在深度学习、自然语言处理、计算机视觉等多个领域的技术积累。尤其是在扩散模型（DiT）架构上的持续优化，使得百度在图像生成质量与速度之间找到了平衡点。

战略布局背后的技术逻辑

不同于字节跳动依靠豆包、扣子等应用反哺模型升级，百度走的是“技术+产品”双轮驱动的路子。

底层：构建统一的多模态训练框架，实现文本、图像、视频混合训练。
中层：强化推理引擎，提升模型部署效率。
上层：落地到教育、娱乐、电商等多个应用场景，如小度学习机Z30、超拟真数字人等。

这种闭环策略，让百度既能保持技术领先，又能快速将成果转化为实际生产力。

挑战与质疑：技术透明性成焦点

尽管百度在多模态领域取得了不少进展，但外界对其技术透明性的质疑仍未停止。

有用户指出：“百度在宣传中提到‘多项基准测试’，但却未公布具体的数据集和评测机构，这让人很难判断其真实水平。”

此外，面对DeepSeek、阿里通义千问、腾讯混元等竞品的快速迭代，百度能否维持领先地位，依然是一个未知数。

未来展望：AI基础设施的下一程

正如李彦宏在迪拜AI峰会上所言：“当前的创新速度比以往任何时候都快，大模型的推理成本每年能降低90%以上。”

百度正加大在AI基础设施上的投入，包括自研芯片昆仑芯、飞桨平台的持续优化，以及文心一言生态的建设。

可以预见，未来的AI竞争不再是单一模型的较量，而是生态系统的全面对决。而百度，正在用多模态这条主线，串联起从底层硬件到上层应用的完整链条。

本文分类：36KR热点
本文标签：AI大模型多模态百度文心技术战略 Sora对比文心4.5Turbo AI基础设施
浏览次数：67 次浏览
发布日期：2025-05-22 12:17:44
本文链接：https://www.toutiaox.com/36KR/104247.html

上一篇 > 抖快红B再争“知识区”，牌局能否突变？
下一篇 > 穷途末路的芯片教父，以巨贪14亿收场

坚持不做Sora，百度为何又开始重视多模态大模型？

引言：AI浪潮下的“变与不变”

Sora的冲击与百度的选择

多模态：百度的新战场

战略布局背后的技术逻辑

挑战与质疑：技术透明性成焦点

未来展望：AI基础设施的下一程

评论列表共有 0 条评论

发表评论取消回复

坚持不做Sora，百度为何又开始重视多模态大模型？

引言：AI浪潮下的“变与不变”

Sora的冲击与百度的选择

多模态：百度的新战场

战略布局背后的技术逻辑

挑战与质疑：技术透明性成焦点

未来展望：AI基础设施的下一程

AI大模型全家桶来袭，微博成新战场！

AI大模型DeepSeek流量暴跌背后，全球竞争格局大变！

大模型竞争：落后生的两条追赶路线｜AI创业公司的突围之战

从“六小龙”到“四小强”，零一和百川为何掉队？

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复