谷歌Gemma 3横空出世,单GPU运行27B参数模型!Qwen 2.5面临新挑战 谷歌最新发布的Gemma 3模型以其高效的参数使用和强大的多模态能力引发了广泛关注。本文从个人视角出发,深入探讨了Gemma 3的技术特点及其对Qwen 2.5系列带来的挑战,同时展望了未来AI模型的发展趋势。 36KR热点 2025年03月14日 17:05 0 点赞 0 评论 88 浏览
26岁OpenAI“吹哨人”Suchir Balaji自杀身亡:我眼中的版权争议与科技伦理 26岁的Suchir Balaji,这位曾公开质疑ChatGPT版权问题的“吹哨人”,不幸在家中自杀身亡。本文从个人视角出发,探讨了Balaji的离世背后所揭示的版权争议与科技伦理问题。 IT热点 2024年12月14日 22:40 0 点赞 0 评论 101 浏览
DeepSeek的思维链:真实思考还是模拟人类? 本文探讨了DeepSeek模型展示的思维链是否是其真实思考过程,还是为了更像人类而设计的。通过对比DeepSeek与GPT在文化批判任务中的表现,以及分析透明化思维链的意义和潜在风险,文章提出了对未来AI技术发展的思考。 知乎热点 2025年02月22日 10:55 0 点赞 0 评论 72 浏览
知乎热议:DeepSeek的回答引发的深度思考 本文从小明的角度出发,探讨了知乎上关于DeepSeek的回答引发的深度思考,包括多角度思考与自我纠错、强大的自然语言处理能力以及理性看待中美AI差距等内容。 知乎热点 2025年01月30日 21:41 0 点赞 0 评论 96 浏览
为什么AI大模型会误认为strawberry里有2个r? 本文探讨了AI大模型为何会误认为strawberry中有两个r的问题,分析了训练数据、上下文理解及算法设计等多方面原因,并提出了改进建议。 知乎热点 2025年02月19日 02:11 0 点赞 0 评论 480 浏览
深度参与DeepSeek开源周:见证国产AI企业的技术革新 本文详细记录了作者参与DeepSeek开源周的亲身经历,深入探讨了国产AI企业在技术革新方面的最新进展,包括自然语言处理和计算机视觉领域的突破性成果。 简书热点 2025年03月04日 19:31 0 点赞 0 评论 69 浏览
OpenAI圣诞大礼包:12天连更,Sora与满血版o1震撼登场 OpenAI宣布将在圣诞节期间推出为期12天的“圣诞大礼包”,其中最引人注目的当属满血版o1和Sora的正式亮相。本文详细介绍了Sora在视频生成方面的突破,以及满血版o1在自然语言处理和图像生成上的提升,同时探讨了OpenAI的透明度与社区参与。 36KR热点 2024年12月06日 11:52 0 点赞 0 评论 103 浏览
浙大校友革新Transformer,多token注意力让LLM错误率归零! 作为一名技术爱好者,他被浙大校友团队提出的多token注意力机制深深吸引。这项技术不仅大幅提升了LLM的性能,还让错误率几乎归零。通过深入分析Ling-Plus框架的原理与优势,他看到了这项技术在未来AI领域的巨大潜力。 36KR热点 2025年04月04日 08:47 0 点赞 0 评论 85 浏览
缅怀天才科学家:今天,整个AI圈都在为他默哀 今天,整个AI圈都在缅怀一位刚刚离世的天才科学家李华。本文以第三人称视角叙述了作者与其相识相知的过程以及他对AI领域的巨大贡献。 腾讯热点 2025年01月03日 15:15 0 点赞 0 评论 71 浏览
文心大模型4.5发布在即,他提前揭秘:AI未来已来 本文以个人视角详细解读即将发布的文心大模型4.5的核心功能及潜在影响,涵盖语言理解、多模态融合、推理对话等关键领域,同时探讨其对未来AI发展的重要意义。 百度热点 2025年02月28日 15:46 0 点赞 0 评论 364 浏览