深度学习 - 头条X

直逼DeepSeek-R1-32B，碾压李飞飞s1-32B：UC伯克利等开源全新SOTA推理模型

本文详细介绍了由斯坦福、UC伯克利等机构联合发布的全新开源推理模型OpenThinker-32B，分析了其性能优势和技术特点，并探讨了其在实际应用中的潜力及未来发展方向。

36KR热点 2025年02月14日 12:52 0 点赞 0 评论 95 浏览

PyTorch灵魂人物的出走：ChatGPT之母背后的故事

PyTorch灵魂人物放弃大厂offer，选择加入ChatGPT之母OpenAI，与Ilya奥特曼携手共创未来。本文深入探讨了他的职业选择背后的原因及对未来的影响。

36KR热点 2025年03月06日 10:20 0 点赞 0 评论 95 浏览

天才少女罗福莉的新征程：从AI实验室到职场新岗位

95后AI天才少女罗福莉已正式到新岗位上班，她的职业生涯新篇章引发广泛关注。本文详细回顾了罗福莉的成长历程、职业选择以及她在新岗位上的表现，同时展望了她在AI领域的未来发展。

百度热点 2025年02月18日 00:26 0 点赞 0 评论 95 浏览

用Python可以开发一个简单的人工智能吗？

本文从个人视角出发，探讨了用Python开发简单人工智能的可能性。通过介绍Python在AI领域的优势，分享了一些有趣的案例，并分析了当前面临的挑战与机遇。

知乎热点 2025年01月07日 02:35 0 点赞 0 评论 95 浏览

历史分水岭：DeepSeek GitHub星数超越OpenAI，低成本推理模型如何撼动行业？

DeepSeek在GitHub上的星数超越OpenAI，标志着AI领域的重要转折点。本文从价格优势、开源战略、成本优化等多个角度深入解析DeepSeek的成功秘诀，并探讨其对未来AI行业的影响。

36KR热点 2025年02月08日 11:21 0 点赞 0 评论 95 浏览

实测o3/o4-mini：3分钟解决欧拉问题，OpenAI最强模型名副其实

作为一名科技爱好者，他深入研究了OpenAI最新发布的o3和o4-mini两款推理模型。经过实际测试发现，o4-mini在解决复杂问题时表现出惊人的速度，仅用2分55秒便完成了原本需要30分钟才能解决的Project Euler问题。同时，o3在数学推理等领域也有出色表现。两者各具特色，将在科研、教育等多个领域发挥重要作用。

36KR热点 2025年04月19日 13:00 0 点赞 0 评论 95 浏览

DeepSeek开源周第二弹：DeepEP全栈通信库引发AI圈热议

DeepSeek在开源周第二天发布了DeepEP全栈通信库，该工具通过优化GPU间的信息传输效率，有效缓解了AI从业者的算力焦虑。本文从个人视角出发，详细解析了DeepEP的技术特点及其对行业的影响，同时探讨了DeepSeek与国产大模型的竞争态势。

头条热点 2025年02月26日 01:56 0 点赞 0 评论 96 浏览

DeepSeek V3模型小版本升级：各项能力全面进阶

作为一名AI技术爱好者，我深入研究了DeepSeek V3模型的小版本升级内容。这次升级不仅提升了模型的各项能力，还扩展了其应用场景。从推理速度到成本控制，V3模型都展现了卓越的性能。同时，市场对V3模型的反响也非常热烈，相信在未来，它将在更多领域发挥重要作用。

IT热点 2025年03月26日 11:51 0 点赞 0 评论 96 浏览

樊登谈AI知识获取：已知的延伸还是认知的革命？

作为一名热爱学习的人，我深刻感受到AI技术对知识获取方式的巨大影响。樊登的观点引发了我对AI知识边界的思考，同时提醒我们要注重经典阅读的价值。在这篇探讨中，我结合多个案例分析了AI的优势与局限性，以及如何在信息爆炸的时代找到适合自己的解药。

头条热点 2025年04月24日 16:00 0 点赞 0 评论 97 浏览

动态场景与开放文本查询：清华哈佛联合建模4D语言场

作为一名热爱技术的观察者，他深入探讨了清华大学与哈佛大学联合开发的4D语言场模型。这项技术不仅能够提升语言模型的理解能力，还支持动态场景和开放文本查询，为未来的人工智能应用提供了无限可能。

36KR热点 2025年04月02日 21:07 0 点赞 0 评论 97 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期