2万亿巨兽来袭,小扎亮底牌,首次回应Llama 4风暴,开源榜单背锅 Meta最新发布的Llama 4系列模型引发开源社区争议,实测效果不及预期,榜单疑似造假,小扎首次回应风暴。 36KR热点 2025年05月01日 08:10 0 点赞 0 评论 45 浏览
大模型竞争:落后生的两条追赶路线|AI创业公司的突围之战 本文聚焦国产AI大模型行业的激烈竞争,探讨落后企业在资源受限背景下选择的两条追赶路线:一是通过工程技术创新降低成本,二是构建自主可控的算力生态。文章结合近期热点事件及行业动态,分析了‘六小虎’的现状与转型策略,并以智谱AI、猿辅导、火山引擎等为例,展示突围企业的实践路径。 36KR热点 2025年06月26日 19:12 0 点赞 0 评论 45 浏览
推理大模型1年内撞墙?性能天花板真的来了吗? 本文围绕36kr热搜话题“推理大模型1年内就会撞墙,性能无法再扩展几个数量级”展开分析,结合近期AI领域热点事件和技术动态,探讨大模型发展面临的挑战与未来趋势。 36KR热点 2025年05月14日 11:37 0 点赞 0 评论 45 浏览
那个总站在大模型C位的传奇男子:从DeepSeek到技术信仰的破圈之路 本文聚焦于AI领域那位始终站在大模型技术C位的传奇男子,从DeepSeek的爆红到Kimi长文本能力的突破,再到GShard与Switch Transformer的技术革新,揭示其背后的技术信仰与未来布局。 36KR热点 2025年05月11日 13:10 0 点赞 0 评论 46 浏览
你永远叫不醒装睡的大模型,多轮对话全军覆没,性能暴跌39%?我亲测了五款主流大模型 一位自媒体创作者亲自测试了五款主流大模型在多轮对话中的表现,发现一旦走偏,后续无论如何引导都无法纠正,这种现象被称为「对话迷失」,严重影响了大模型的可靠性。 36KR热点 2025年06月10日 01:00 0 点赞 0 评论 49 浏览
2025年AI大模型谁能笑到最后? 作为一名关注AI发展的观察者,他见证了2025年AI大模型领域的激烈竞争。中美顶级AI模型的性能差距缩小到0.3%,中国企业如字节跳动、百度智能云等在AI Agent智能体商业化方面取得显著进展。同时,他也注意到生成式AI的技术天花板以及多模态大模型向世界模型迈进的趋势。 知乎热点 2025年04月13日 18:05 0 点赞 0 评论 49 浏览
从DeepSeek看梁文锋:一个不急着赚钱的AI创业者,如何赢得行业尊重? DeepSeek创始人梁文锋以独特的创业理念和技术专注度,在AI赛道中脱颖而出。他拒绝大厂投资、重视年轻人、坚持长期主义,成为行业中少见的“技术派创业者”。本文从多个角度剖析梁文锋的成长轨迹与DeepSeek的发展逻辑。 36KR热点 2025年05月10日 23:55 0 点赞 0 评论 50 浏览
小米华为抢人大战:AI大模型领域的人才争夺白热化 小米和华为在AI大模型研发领域展开激烈的人才争夺战,本文以第三人的视角深入分析了两家企业各自的策略及行业现状,探讨了AI人才的重要性及其对未来的影响。 百度热点 2025年03月02日 08:20 0 点赞 0 评论 50 浏览
阶跃星辰:一场不被看好的豪赌,却在多模态AI赛道杀出血路 阶跃星辰作为AI大模型‘六小虎’之一,凭借多模态技术优势和高频模型迭代迅速崛起。本文以第三方视角解析其技术策略、企业文化及未来发展路径。 36KR热点 2025年05月12日 16:44 0 点赞 0 评论 56 浏览
梁文锋署名DeepSeek新论文:公开V3大模型降本方法|AI行业迎来性价比革命 DeepSeek近日发布的新论文揭示了其V3大模型如何通过技术创新实现成本下降60%,并通过开源与API降价推动AI普惠化发展。 36KR热点 2025年05月16日 09:27 0 点赞 0 评论 59 浏览