深度解析DeepSeek新成果:实习生如何挑大梁,加速AI训练推理 DeepSeek团队发布新论文,介绍改进的稀疏注意力机制NSA,显著加速AI训练推理。梁文锋亲自参与研发,实习生挑大梁,实现技术突破。 36KR热点 2025年02月19日 16:31 0 点赞 0 评论 91 浏览
OpenAI o3震撼发布:高计算模式每任务花费数千美元,推理能力再创新高 OpenAI发布全新人工智能推理模型o3及o3 mini,其中o3在高计算模式下每任务花费数千美元,展现了卓越的推理能力。同时,o3 mini将于2025年初推出,降低使用门槛,吸引更多开发者参与。 36KR热点 2024年12月22日 09:40 0 点赞 0 评论 91 浏览
DeepSeek-R1 持续刷屏,连 Open R1 都来了!抱抱脸发起,1 天狂揽 1.9k 星 DeepSeek-R1 开源大模型在 GitHub 上一夜走红,1 天内获得 1.9k 标星。该模型不仅在多项基准测试中表现出色,还在开源社区中掀起了巨大波澜。 IT热点 2025年01月27日 13:10 0 点赞 0 评论 89 浏览
飞蛾扑火算法:用MATLAB实现的奇妙之旅 本文详细介绍了飞蛾扑火算法的原理及其在MATLAB中的实现步骤,分享了作者在实现过程中遇到的挑战和心得,适合对优化算法感兴趣的读者阅读。 简书热点 2024年11月29日 23:57 0 点赞 0 评论 89 浏览
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实 作为一名科技爱好者,他深入研究了OpenAI最新发布的o3和o4-mini两款推理模型。经过实际测试发现,o4-mini在解决复杂问题时表现出惊人的速度,仅用2分55秒便完成了原本需要30分钟才能解决的Project Euler问题。同时,o3在数学推理等领域也有出色表现。两者各具特色,将在科研、教育等多个领域发挥重要作用。 36KR热点 2025年04月19日 13:00 0 点赞 0 评论 89 浏览
谷歌Gemma 3横空出世,单GPU运行27B参数模型!Qwen 2.5面临新挑战 谷歌最新发布的Gemma 3模型以其高效的参数使用和强大的多模态能力引发了广泛关注。本文从个人视角出发,深入探讨了Gemma 3的技术特点及其对Qwen 2.5系列带来的挑战,同时展望了未来AI模型的发展趋势。 36KR热点 2025年03月14日 17:05 0 点赞 0 评论 89 浏览
DeepSeek挑战OpenAI:GPT-5免费计划或将改变行业格局 DeepSeek以其开源和免费策略迅速崛起,对闭源巨头OpenAI形成了巨大压力。本文从技术发展、市场竞争及对中国市场的启示等多个角度深入探讨了这场AI领域的变革。 36KR热点 2025年02月13日 14:42 0 点赞 0 评论 89 浏览
OpenAI 推出「满血版」推理模型 o1 和 ChatGPT Pro,有哪些技术亮点? OpenAI 推出的「满血版」推理模型 o1 和 ChatGPT Pro 在性能、多模态推理能力、对话理解和技术创新等方面带来了诸多亮点。本文将从个人视角深入探讨这些新模型的技术特点和应用前景。 知乎热点 2024年12月06日 10:40 0 点赞 0 评论 89 浏览
牛津教授的惊人预言:AI将超越人类科研速度500倍,真相究竟如何? 作为一名关注前沿科技动态的人,我最近了解到牛津大学一位教授提出了一个惊人的预言:未来十年内,AI可能完成相当于人类100年的科学发现,其科研效率更是超过了人类500倍。这让我深感震撼,同时也引发了我对AI未来发展潜力及其可能带来影响的思考。 36KR热点 2025年03月26日 21:46 0 点赞 0 评论 89 浏览
全球AI竞赛再升级:Claude 3.7与DeepSeek R1的巅峰对决 全球首个混合推理模型Claude 3.7震撼发布,与DeepSeek R1展开激烈竞争。本文从技术特点、应用场景等方面对两款模型进行了详细对比分析,探讨AI未来发展趋势。 36KR热点 2025年02月25日 17:58 0 点赞 0 评论 88 浏览