谷歌DeepMind的Genie 3:开启世界模型新时代 讲述了谷歌DeepMind推出的Genie 3的强大功能和广泛应用前景,以及它在AI领域竞争中的独特之处。 36KR热点 2025年08月17日 19:45 0 点赞 0 评论 42 浏览
美国奥数题成AI数学噩梦:顶级模型集体翻车,DeepSeek如何逆袭成功? 作为一名AI观察者,他深入分析了近期美国奥数题引发的AI数学推理危机。顶级模型如GPT-4.5、Claude 3.7 Sonnet等在ARC-AGI-2测试中表现惨淡,得分普遍低于5%。然而,DeepSeek的R1模型却凭借独特算法实现了逆袭。文章详细探讨了AI失败的原因及未来发展方向,呼吁行业重视基础理论突破。 36KR热点 2025年04月02日 19:47 0 点赞 0 评论 78 浏览