深度学习 - 头条X

本文从小明的视角出发，详细解读了微软论文意外曝光GPT核心机密事件。通过分析4o-mini和o1模型的特点以及GPT的技术原理，探讨了这一发现对AI行业的深远影响。

36KR热点 2025年01月02日 21:57 0 点赞 0 评论 108 浏览

作为一名热爱技术的探索者，他深入研究了OpenAI最新发布的开源大模型及其轻量版Deep Research。从图像生成到开源模型，再到免费使用的轻量版，每一项技术都展现了OpenAI对未来AI发展的深刻理解与战略布局。

36KR热点 2025年04月26日 04:07 0 点赞 0 评论 78 浏览

美团搜推机器学习团队开源了INT8无损满血版DeepSeek R1模型，实现了对原生FP8模型的基本无损量化，大幅降低了硬件要求并提升了性能。本文从技术实现、实际应用及未来展望等多个角度，详细解读了这一重要成果。

IT热点 2025年03月08日 21:00 0 点赞 0 评论 86 浏览

作为一名技术爱好者，他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能，还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势，他看到了这项技术在未来AI领域的巨大潜力。

36KR热点 2025年04月04日 08:47 0 点赞 0 评论 98 浏览

本文从个人视角出发，详细解析了DeepSeek开源周发布的FlashMLA项目，探讨其技术特点及开源战略意义，并对未来发展趋势进行了展望。

36KR热点 2025年02月26日 10:50 0 点赞 0 评论 118 浏览

李飞飞教授带领团队用不到50美元成功训练出一款性能卓越的新模型，采用最简化的测试时间扩展方法，仅需让模型训练约1000个问题，即可获得超越传统模型的强大推理能力。

头条热点 2025年02月07日 02:36 0 点赞 0 评论 108 浏览

作为一名科技爱好者，他深入探讨了OpenAI最新发布的o3和o4-mini模型的强大功能及其意义。从复杂的推理能力到图像生成的技术革新，这些模型正引领着AI领域的全新发展方向。

知乎热点 2025年04月17日 09:26 0 点赞 0 评论 71 浏览

本文详细介绍了UCLA等研究团队如何通过纯强化学习复现DeepSeek-R1模型的“啊哈时刻”，以及这一突破对AI技术发展的重要意义。文章从技术原理、实际应用及未来展望等多个角度进行了深入探讨。

36KR热点 2025年03月06日 04:36 0 点赞 0 评论 94 浏览

新版GPT-4o强势超越DeepSeek-R1，成为当前最强大的语言模型之一。本文从成本、性能、行业动态等多个角度分析了GPT-4o的优势，并探讨了奥特曼公司即将发布的GPT-4.5可能带来的影响。

36KR热点 2025年02月17日 17:46 0 点赞 0 评论 82 浏览

英伟达宣布创造满血DeepSeek-R1模型AI推理性能的世界纪录，本文详细解读了DeepSeek-R1的性能表现、各大厂商的支持情况以及实际应用场景，并对未来算力需求进行了展望。

IT热点 2025年03月19日 21:37 0 点赞 0 评论 80 浏览

深度学习

首页

深度学习