实探Manus总部:一场AI界的颠覆还是泡沫狂欢? 本文以个人视角实地探访Manus总部,探讨这款被称作“全球首款通用型AI智能体”的产品是否真的具有颠覆性,同时剖析其技术亮点与市场争议。 36KR热点 2025年03月07日 09:57 0 点赞 0 评论 98 浏览
DeepSeek开源周第二弹:DeepEP全栈通信库引发AI圈热议 DeepSeek在开源周第二天发布了DeepEP全栈通信库,该工具通过优化GPU间的信息传输效率,有效缓解了AI从业者的算力焦虑。本文从个人视角出发,详细解析了DeepEP的技术特点及其对行业的影响,同时探讨了DeepSeek与国产大模型的竞争态势。 头条热点 2025年02月26日 01:56 0 点赞 0 评论 98 浏览
浙大校友革新Transformer,多token注意力让LLM错误率归零! 作为一名技术爱好者,他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能,还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势,他看到了这项技术在未来AI领域的巨大潜力。 36KR热点 2025年04月04日 08:47 0 点赞 0 评论 98 浏览
DeepSeek爆火背后:不可忽视的三大趋势 本文深入探讨了DeepSeek爆火背后的三大趋势,包括架构创新、低成本训练模式以及开源生态的建设,揭示了AI产业未来的发展方向。 36KR热点 2025年02月21日 17:23 0 点赞 0 评论 98 浏览
实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实 作为一名科技爱好者,他深入研究了OpenAI最新发布的o3和o4-mini两款推理模型。经过实际测试发现,o4-mini在解决复杂问题时表现出惊人的速度,仅用2分55秒便完成了原本需要30分钟才能解决的Project Euler问题。同时,o3在数学推理等领域也有出色表现。两者各具特色,将在科研、教育等多个领域发挥重要作用。 36KR热点 2025年04月19日 13:00 0 点赞 0 评论 97 浏览
动态场景与开放文本查询:清华哈佛联合建模4D语言场 作为一名热爱技术的观察者,他深入探讨了清华大学与哈佛大学联合开发的4D语言场模型。这项技术不仅能够提升语言模型的理解能力,还支持动态场景和开放文本查询,为未来的人工智能应用提供了无限可能。 36KR热点 2025年04月02日 21:07 0 点赞 0 评论 97 浏览
新王诞生:DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史 DeepSeek双模型GitHub Star数首次超越OpenAI,成为大模型领域新标杆。本文深入分析DeepSeek的技术创新、低成本策略及对行业的深远影响,探讨开源模式如何改变AI发展轨迹。 IT热点 2025年02月08日 00:01 0 点赞 0 评论 97 浏览
DeepSeek开源周第三天推出DeepGEMM,有哪些亮点值得关注? DeepSeek开源周第三天推出了DeepGEMM,这是一款针对矩阵乘法运算进行深度优化的代码库。本文详细解析了DeepGEMM的核心亮点及其潜在应用前景,揭示了其对AI行业的深远影响。 知乎热点 2025年02月26日 13:11 0 点赞 0 评论 96 浏览
AMD火速“站台”DeepSeek:AI领域的强强联合 AMD宣布将DeepSeek-V3模型集成到最新GPU上,标志着两家公司在AI领域的深度合作。本文深入探讨了这一合作背后的意义及未来前景。 头条热点 2025年01月27日 00:37 0 点赞 0 评论 96 浏览
DeepSeek V3模型小版本升级:各项能力全面进阶 作为一名AI技术爱好者,我深入研究了DeepSeek V3模型的小版本升级内容。这次升级不仅提升了模型的各项能力,还扩展了其应用场景。从推理速度到成本控制,V3模型都展现了卓越的性能。同时,市场对V3模型的反响也非常热烈,相信在未来,它将在更多领域发挥重要作用。 IT热点 2025年03月26日 11:51 0 点赞 0 评论 96 浏览