DeepSeek R2模型或将提前发布,AI领域迎来新突破 DeepSeek正在加速推出其R2人工智能模型,原计划五月份发布,现努力提前推出。新模型有望生成更高质量代码,提升语言处理能力,成为AI领域的重要突破。 IT热点 2025年02月26日 14:33 0 点赞 0 评论 60 浏览
浙大校友革新Transformer,多token注意力让LLM错误率归零! 作为一名技术爱好者,他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能,还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势,他看到了这项技术在未来AI领域的巨大潜力。 36KR热点 2025年04月04日 08:47 0 点赞 0 评论 60 浏览
实测GPT-4.5:全网吐槽的OpenAI顶配模型,他却发现了这个隐藏亮点 一名技术爱好者深入体验GPT-4.5后,揭示了这款备受争议的模型背后隐藏的独特亮点,尤其是情感化交互方面的突破性进展。 36KR热点 2025年03月01日 11:46 0 点赞 0 评论 61 浏览
DeepSeek:AI领域的革新者还是平庸的追随者? 文章探讨了DeepSeek在AI领域的地位及影响,分析其技术实力、市场表现以及未来发展潜力,旨在为读者提供全面视角。 微博热点 2025年03月03日 12:30 0 点赞 0 评论 61 浏览
DeepSeek-R1超高幻觉率解析:为何大模型总“胡说八道”? 本文从个人视角出发,深入探讨了DeepSeek-R1大语言模型的“幻觉”问题及其背后的原因,并提出了相应的解决策略。文章旨在帮助读者更好地理解大模型的工作原理及局限性。 36KR热点 2025年02月13日 10:05 0 点赞 0 评论 62 浏览
谷歌Gemma 3横空出世,单GPU运行27B参数模型!Qwen 2.5面临新挑战 谷歌最新发布的Gemma 3模型以其高效的参数使用和强大的多模态能力引发了广泛关注。本文从个人视角出发,深入探讨了Gemma 3的技术特点及其对Qwen 2.5系列带来的挑战,同时展望了未来AI模型的发展趋势。 36KR热点 2025年03月14日 17:05 0 点赞 0 评论 62 浏览
LLM推理暴涨,DeepSeek华人团队引领AI新纪元 DeepSeek华人团队通过技术创新,推动了LLM推理能力的大幅提升,为中国AI的发展注入了强大动力。本文从技术、市场、竞争等多个角度分析了DeepSeek的成功原因及其对行业的影响。 36KR热点 2025年02月18日 01:11 0 点赞 0 评论 65 浏览
OpenAI 推出「满血版」推理模型 o1 和 ChatGPT Pro,有哪些技术亮点? OpenAI 推出的「满血版」推理模型 o1 和 ChatGPT Pro 在性能、多模态推理能力、对话理解和技术创新等方面带来了诸多亮点。本文将从个人视角深入探讨这些新模型的技术特点和应用前景。 知乎热点 2024年12月06日 10:40 0 点赞 0 评论 66 浏览
从奥特曼的视角看ChatGPT的挑战:AI发展的反思 本文从个人视角出发,讲述了ChatGPT面临的挑战及其背后的故事,包括资源消耗、用户期望差异以及内部调整等内容。 36KR热点 2025年01月07日 17:50 0 点赞 0 评论 66 浏览
体验新版GPT-4o后,我为何要感谢DeepSeek? 本文以第一人称视角详细记录了作者对新版GPT-4o的使用体验,并探讨了OpenAI在成人内容政策上的调整。同时,文章表达了对DeepSeek公司的感谢,强调其在AI领域的独特贡献。 36KR热点 2025年02月19日 19:42 0 点赞 0 评论 66 浏览