AI高考成绩出炉！豆包、GPT-4o谁更胜一筹？

67 阅读 0 评论 0 点赞 AI原创

最近，各大平台陆续发布了2024年大模型在高考中的评测结果，引发了网友们的热议。这些AI‘考生’的表现如何？它们在哪些科目上表现突出，又有哪些短板？本文将为你一一揭晓。

📚 文科状元花落谁家？

在今年的文科考试中，GPT-4o以562分的成绩拔得头筹，稳居榜首。而国内产品中，字节跳动旗下的豆包表现不俗，以542.5分紧随其后，成为国产AI中的佼佼者。

AI高考中文科成绩排行榜

此外，百度的文心一言4.0也取得了537.5分的好成绩，排名第三。从整体来看，国产AI在文科方面的进步非常明显，已经逐渐缩小与国际领先水平的差距。

相比文科，理科的考试难度显然更高。尤其是在数学这一科目上，9款大模型中仅有GPT-4o、文心一言4.0和豆包三款产品突破了60分的大关（满分150分）。

AI高考数学成绩对比图

值得一提的是，由好未来自主研发的九章大模型是唯一一个专注于数学领域的AI“考生”。尽管它的总分不如其他综合型大模型，但在数学解题方面的能力却非常突出，覆盖了从小学到高中的各类题型。

不过，在物理和化学两门学科中，大模型的整体表现并不理想。平均分数分别只有34分和39分，其中化学单项最高分仅为49.5分，显示出AI在理科推理和计算能力上的不足。

从去年到今年，国产AI的进步可谓突飞猛进。以豆包为例，它在去年的文科总分仅为542.5分，而今年则提升了140.5分；理科方面更是从466.5分跃升至607分，增长幅度高达181.5分。

这种快速提升的背后，离不开技术的不断迭代和训练数据的优化。越来越多的企业开始重视AI在教育领域的应用，投入大量资源进行研发。

与此同时，像讯飞星火这样的国产AI也在多学科综合能力上表现出色，甚至一度超越了GPT-4o，成为本届“大模型高考”中的黑马。

虽然大模型在高考中取得了一定的成绩，但它们距离真正理解和掌握知识还有很长的路要走。尤其是在理科领域，AI的逻辑推理和复杂计算能力仍需进一步提升。

不过，随着技术的发展，我们有理由相信，未来的AI不仅能在考试中取得更好的成绩，还能在实际教学中发挥更大的作用，帮助学生更好地学习和成长。