一、大模型与开发者
在 WAIC 上,一位 AI 应用开发者表示:“模型的第一批用户,肯定是开发者,如果没有抓住开发者,模型的声量是很难起来的。”他还把开源比喻成大模型触达开发者的门,“现在找到开发者是很简单的。”
二、世界模型的质量衡量
弗鲁克特提到,衡量世界模型质量很困难,尤其是在视觉生成方面,因为质量比较主观。对于语言模型来说,可以用困惑度或者下游任务的表现来进行评估,但世界模型主要是关注视觉交互。而且质量取决于使用场景,他们的目标就是让 AI 智能体能够在模拟环境中交互。
三、AI 的智能化之路
姚欣认为,AI 要走向智能化,就需要 Agentic AI 基础设施服务平台,而 MCP 只不过是大厂的“羊毛”,并不能解决根本性问题。关于中美 AI 大模型,他观察到中国公司都在加速“卷”开源模型。
四、合成数据的双刃剑效应
合成数据虽然能在一定程度上缓解数据难题,但也带来了一些新挑战。一项发表在《自然》上的研究表明,若放任大模型利用生成的数据进行训练,AI 可能会崩溃。
五、AI 创意的普惠化
借助高质量的 AI 模型,互联网上的内容与创意变得越来越普及,低门槛让更多人的创意得以发挥。不过,AI 的使用也超出了最初的设计与预期。
六、企业 AI 系统的发展趋势
Gartner 预测,到 2027 年,70% 的企业 AI 系统将会采用“预训练 - 微调 - 后训练优化”的三级流水线。这种全新的架构和训练范式的变革,为下一代基础大模型的构建提供了方向。
七、AI 与神经科学的结合
随着大语言模型能力的强大,AI 与神经科学的联系愈发紧密,产生了 NeuroAI 这个新兴领域。从两个角度看,一是用 AI 来研究大脑(AI for Neuro),二是……(此处省略部分内容)。
八、国产 AI 大模型的进步
在最近的一轮测试里,表现最佳的国产 AI 大模型竟是上一轮测试中表现欠佳的豆包和通义,这两款大模型提供了更详细的数据和法拉第未来的战略,相比之下,DeepSeek、文心、Kimi 就显得少些。
九、投资与大模型的经济效用
投资应聚焦于有经济效用的产品和技术,即大模型和 AI 产品得成为能创造商业价值的公司。然而,模型越来越聪明与它具备经济效用间的关系并不明确。
十、大型推理模型的能力
新一代前沿语言模型引入了大型推理模型(LRMs),这类模型会在给出最终答案前先生成详细的思考过程。它们在各种推理基准上的表现有了很大提升,不过其基本能力和潜力仍需进一步探究。
发表评论 取消回复