DeepSeek-V3.1震撼面世!全球开源编程再攀高峰 8月21日,DeepSeek正式发布最新大语言模型DeepSeek - V3.1,距上次发布仅过5个月。此次升级包含混合推理架构等诸多变化,且已在全球开源。它被认为是迈向Agent时代的重要一步。 36KR热点 2025年08月22日 07:46 0 点赞 0 评论 31 浏览
百度数字人技术NOVA闪耀WAIC,开启未来新篇章! 百度新一代数字人技术NOVA在WAIC亮相引发关注。数字人技术融合大语言模型与多模态技术,已在直播带货等领域应用,如罗永浩团队在百度电商平台的直播。未来数字人技术有望更智能化、个性化发展。 百度热点 2025年07月26日 14:06 0 点赞 0 评论 37 浏览
Transformer创始人创业公司推出一句话生成专属LoRA,颠覆LLM微调技术! Transformer创始人团队推出的‘一句话生成任务专属LoRA’技术,正在颠覆传统LLM微调方式,极大降低AI模型定制门槛。 36KR热点 2025年06月14日 12:17 0 点赞 0 评论 41 浏览
英伟达开源新王登顶!14万H100小时训练细节曝光,DeepSeek-R1再掀AI风暴 英伟达开源新模型 Perception-R1,采用 GRPO 强化学习技术,挑战 DeepSeek-R1 霸主地位。文章深入解析训练细节、成本构成及开源竞争格局。 36KR热点 2025年05月06日 21:51 0 点赞 0 评论 51 浏览
为什么感觉谷歌已经赢下LLM竞赛了?一个普通用户的深度观察 本文从一名普通用户的角度出发,分析了谷歌在LLM竞赛中的战略布局和技术优势,结合实际使用体验,探讨了其为何可能已在这场人工智能竞赛中占据领先地位。 知乎热点 2025年05月04日 04:30 0 点赞 0 评论 40 浏览
DeepSeek-Prover-V2-671B 新模型开源发布:AI 推理领域迎来新变革 DeepSeek 最新推出的 DeepSeek-Prover-V2-671B 开源模型正式上线 Hugging Face,采用高效 safetensors 格式,引发 AI 社区广泛关注。 IT热点 2025年05月01日 11:50 0 点赞 0 评论 44 浏览
DeepSeek 小力出奇迹:一个AI新星的崛起之路 本文讲述了DeepSeek这家创新型科技公司如何以“性价比高”的优势迅速崛起,并通过发布多个成功的AI模型,特别是最新的DeepSeek-R1大模型,在全球范围内引起了广泛关注。文章详细介绍了公司的成立背景、技术创新以及未来展望。 百度热点 2025年01月28日 18:35 0 点赞 0 评论 55 浏览
太火爆了!DeepSeek服务被挤“宕机”,雷军千万年薪挖角的“天才少女”曾是开发者之一 本文讲述了DeepSeek新一代大语言模型DeepSeek-V3发布后引发的热潮以及相关“宕机”事件,并介绍了雷军以千万年薪挖角95后AI“天才少女”罗福莉的故事。 腾讯热点 2025年01月27日 15:51 0 点赞 0 评论 100 浏览
2024新质生产力的新突破:从个人视角看科技与创新的变革 2024年,新质生产力成为推动高质量发展的关键力量。本文从个人视角出发,探讨了新质生产力的定义、具体表现及其对个人生活的影响,并展望了未来的创新发展趋势。 微博热点 2024年12月13日 01:41 0 点赞 0 评论 78 浏览
张一鸣化身“猎头人”,字节AI疯狂挖人将削弱对手? 张一鸣亲自出手,字节跳动在全球范围内疯狂招揽AI人才,尤其是大语言模型和通用人工智能(AGI)领域的顶尖专家。字节跳动的这一举动不仅展示了其对AI领域的高度重视,也引发了竞争对手的高度警惕。 36KR热点 2024年12月10日 15:52 0 点赞 0 评论 74 浏览