离线+记忆:大模型进化的新阶段 离线+记忆在大模型发展中扮演着关键角色。从早期的小规模尝试到现在逐步完善的架构,这一组合不断推动着大模型的进步。文中详细阐述了离线大模型的优势、发展历程中的重要节点、记忆机制存在的问题及改进方向,还有未来的发展趋势等内容。 36KR热点 2025年07月27日 22:51 0 点赞 0 评论 34 浏览
深度解析DeepSeek开源周:从FlashMLA到DeepEP,大模型开源的未来 本文详细解析了DeepSeek开源周的首个成果FlashMLA及其后续计划,探讨了开源对AI行业的影响,并展望了未来的发展趋势。 百度热点 2025年02月26日 13:10 0 点赞 0 评论 52 浏览
深度解析:DeepSeek 首发支持昇腾平台的意义与前景 本文深入探讨了DeepSeek首发支持昇腾平台的背后故事及其对行业的影响,分析了DeepSeek-R1-Lite模型的技术特点和应用场景,展望了DeepSeek未来的发展方向。 知乎热点 2025年01月25日 12:35 0 点赞 0 评论 49 浏览
大模型价格战反转!17家厂商最新定价惊现7成涨价 大模型价格战似乎发生了逆转,通过对17家厂商最新定价的深入挖掘发现,竟有超过7成的厂商在涨价。文中详细分析了MiniMax等厂商的定价情况,并探讨了涨价背后的原因,如研发成本增加、市场需求变化等。还提及了市场对此的反应以及对未来发展的展望。 36KR热点 2025年08月24日 09:42 0 点赞 0 评论 29 浏览
元宝与豆包的较量:腾讯AI大模型的战略布局 作为一名对AI技术感兴趣的观察者,我深入研究了腾讯元宝与字节豆包的竞争态势。从数据表现到战略布局,再到用户体验的差异,我发现这场较量远比表面看起来复杂得多。腾讯通过时间差战略取得了阶段性胜利,但未来的变数依然很多。 36KR热点 2025年03月22日 18:45 0 点赞 0 评论 59 浏览
新王诞生:DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史 DeepSeek双模型GitHub Star数首次超越OpenAI,成为大模型领域新标杆。本文深入分析DeepSeek的技术创新、低成本策略及对行业的深远影响,探讨开源模式如何改变AI发展轨迹。 IT热点 2025年02月08日 00:01 0 点赞 0 评论 67 浏览
字节跳动8位数年薪挖走阿里通义千问技术负责人周畅,背后的故事 字节跳动以8位数年薪挖走阿里通义千问技术负责人周畅,并带走十余名核心团队成员,引发行业震动。本文深入分析了这一事件的背景、影响及未来展望。 IT热点 2024年12月06日 23:22 0 点赞 0 评论 71 浏览
大模型产业新布局:零一万物在苏州的雄心与未来 零一万物与苏州高新区联合成立的产业大模型基地正式授牌,聚焦制造、金融、医疗、政务等领域,推动大模型技术深度融入实体经济,打造新质生产力。同时,抖音电商和星巴克也在各自领域展开战略布局。 36KR热点 2025年02月15日 16:31 0 点赞 0 评论 62 浏览
通义应用团队分拆并入阿里智能信息事业群:个人视角下的深度解读 本文从个人视角深入解读了阿里云“通义”应用团队分拆并入阿里智能信息事业群的背后原因及未来展望,探讨了这一变革对人工智能技术和数字版权行业的影响。 36KR热点 2024年12月18日 16:13 0 点赞 0 评论 75 浏览
谷歌大模型Gemini 2.5 Pro:性价比与思考深度的双重突破 作为一名热爱科技的人,他深入探讨了谷歌最新推出的Gemini 2.5 Pro模型,这款被称为“性价比之王”的混合推理模型,不仅具备自由控制的思考深度,还在竞技场中取得了优异成绩。通过分析其核心优势、性价比以及行业竞争格局,他展示了这款模型对未来科技发展的深远影响。 36KR热点 2025年04月19日 12:57 0 点赞 0 评论 46 浏览