浙大校友革新Transformer,多token注意力让LLM错误率归零! 作为一名技术爱好者,他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能,还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势,他看到了这项技术在未来AI领域的巨大潜力。 36KR热点 2025年04月04日 08:47 0 点赞 0 评论 85 浏览
实测GPT-4.5:全网吐槽的OpenAI顶配模型,他却发现了这个隐藏亮点 一名技术爱好者深入体验GPT-4.5后,揭示了这款备受争议的模型背后隐藏的独特亮点,尤其是情感化交互方面的突破性进展。 36KR热点 2025年03月01日 11:46 0 点赞 0 评论 85 浏览
OpenAI 推出「满血版」推理模型 o1 和 ChatGPT Pro,有哪些技术亮点? OpenAI 推出的「满血版」推理模型 o1 和 ChatGPT Pro 在性能、多模态推理能力、对话理解和技术创新等方面带来了诸多亮点。本文将从个人视角深入探讨这些新模型的技术特点和应用前景。 知乎热点 2024年12月06日 10:40 0 点赞 0 评论 86 浏览
体验新版GPT-4o后,我为何要感谢DeepSeek? 本文以第一人称视角详细记录了作者对新版GPT-4o的使用体验,并探讨了OpenAI在成人内容政策上的调整。同时,文章表达了对DeepSeek公司的感谢,强调其在AI领域的独特贡献。 36KR热点 2025年02月19日 19:42 0 点赞 0 评论 87 浏览
表格处理神器登上Nature,开箱即用,平均2.8s解读任意表格 本文介绍了近期登上Nature杂志的表格处理工具Tabula Recta,详细描述了其功能特点及实际应用效果。 36KR热点 2025年01月09日 18:57 0 点赞 0 评论 88 浏览
谷歌Gemma 3横空出世,单GPU运行27B参数模型!Qwen 2.5面临新挑战 谷歌最新发布的Gemma 3模型以其高效的参数使用和强大的多模态能力引发了广泛关注。本文从个人视角出发,深入探讨了Gemma 3的技术特点及其对Qwen 2.5系列带来的挑战,同时展望了未来AI模型的发展趋势。 36KR热点 2025年03月14日 17:05 0 点赞 0 评论 88 浏览
DeepSeek-R1超高幻觉率解析:为何大模型总“胡说八道”? 本文从个人视角出发,深入探讨了DeepSeek-R1大语言模型的“幻觉”问题及其背后的原因,并提出了相应的解决策略。文章旨在帮助读者更好地理解大模型的工作原理及局限性。 36KR热点 2025年02月13日 10:05 0 点赞 0 评论 89 浏览
xAI 推出 Grok 3 和 Deepsearch:重新定义人工智能的未来 文章详细介绍了埃隆·马斯克旗下xAI公司推出的Grok 3聊天机器人和Deepsearch智能搜索引擎的亮点,包括“思维链”推理机制、超大规模参数、语义分析能力等,并探讨了这些技术对未来的影响。 知乎热点 2025年02月18日 19:20 0 点赞 0 评论 93 浏览
ChatGPT!见证AI的力量! ChatGPT的出现,标志着AI技术进入了一个新的阶段。本文将从个人视角出发,探讨ChatGPT的核心能力、应用场景及未来展望。 简书热点 2024年11月28日 05:27 0 点赞 0 评论 93 浏览
AI界拼多多DeepSeek实力如何?几轮实测后我有了答案 本文作者通过对DeepSeek公司旗下的三款主打产品——TextMaster、ImagePro以及VoiceCraft进行详细测试,分享了自己对这家被誉为“AI界拼多多”的初创企业的独特见解。 36KR热点 2025年01月01日 16:45 0 点赞 0 评论 94 浏览