深度学习

AI破解50年未解数学难题,南大校友用OpenAI模型完成首个非平凡数学证明

作为一名热爱科技的人,亲眼见证了南大校友借助OpenAI模型完成首个非平凡数学证明的奇迹时刻。从深度神经网络到Transformer语言模型,再到强化学习,每一项技术都为这一成就奠定了基础。未来,随着AI for Science的不断发展,我们将迎来一个更加智能化的世界。

GPT-4o升级:聊天鬼才还是生图弱鸡?

作为一名普通用户,他深入体验了GPT-4o的新功能,发现聊天能力和STEM领域表现大幅提升,但生图能力有所减弱。通过实际案例展示了GPT-4o的强大与不足,并对未来改进充满期待。

稚晖君再创奇迹:人形机器人骑自行车,ViLLA架构引领未来

稚晖君及其团队发布的智元启元大模型和人形机器人引发了广泛关注。ViLLA架构的创新设计为人形机器人赋予了强大的学习能力和动作执行能力,使其能够完成诸如骑自行车等高难度任务。本文详细解析了ViLLA架构的工作原理及未来应用前景。

DeepSeek V3模型小版本升级:各项能力全面进阶

作为一名AI技术爱好者,我深入研究了DeepSeek V3模型的小版本升级内容。这次升级不仅提升了模型的各项能力,还扩展了其应用场景。从推理速度到成本控制,V3模型都展现了卓越的性能。同时,市场对V3模型的反响也非常热烈,相信在未来,它将在更多领域发挥重要作用。

DeepSeek的思维链:真实思考还是模拟人类?

本文探讨了DeepSeek模型展示的思维链是否是其真实思考过程,还是为了更像人类而设计的。通过对比DeepSeek与GPT在文化批判任务中的表现,以及分析透明化思维链的意义和潜在风险,文章提出了对未来AI技术发展的思考。

Meta Llama 4震撼登场:参数减半性能翻倍,大模型时代新篇章

作为一名亲历者,他目睹了Llama 4系列的发布过程。从Scout到Maverick再到即将面世的Behemoth,每一款模型都代表着大模型技术的重大突破。尤其是参数减半却性能翻倍的设计理念,以及对H100 GPU的支持,让开发者们看到了更多可能性。同时,DeepSeek的‘代码开源周’也为行业注入了新的活力。