DeepSeek-V3震撼发布,代码能力飙升! 作为一名AI技术爱好者,我深入体验了DeepSeek-V3这款最新发布的大型语言模型。通过对比测试发现,DeepSeek-V3在代码生成能力方面取得了显著突破,特别是在算法类代码场景中表现突出。同时,它在中文能力方面也有很大提升,能够满足多样化需求。海外用户对这款新模型给予了高度评价,认为它是提升工作效率的理想工具。 36KR热点 2025年03月25日 09:45 0 点赞 0 评论 56 浏览
DeepSeek:从辉煌到质疑,真相究竟如何? 本文从个人视角出发,深入剖析了DeepSeek从辉煌到质疑的过程,探讨了其在全球范围内的影响力以及面临的挑战。通过详实的数据和案例,揭示了DeepSeek背后的故事。 抖音热点 2025年02月02日 13:46 0 点赞 0 评论 60 浏览
没想到,最Open的开源新模型,来自小红书?深度解析DeepEyes如何打破边界 小红书与西安交通大学联合推出的多模态深度思考模型DeepEyes,采用端到端强化学习,首次实现不依赖监督微调的视觉推理能力,成为近期最受关注的开源AI模型之一。 36KR热点 2025年06月08日 18:06 0 点赞 0 评论 42 浏览
中国大模型密集开源:一场AI行业的“安卓时刻” 作为一名关注AI领域的观察者,我发现中国大模型开源热潮正在深刻改变整个行业。从DeepSeek到阿里巴巴、百度和腾讯,这些企业的开源举措不仅降低了技术门槛,还推动了AI技术在各行业的广泛应用。然而,我们也需要正视其中存在的风险与挑战。 百度热点 2025年03月26日 13:25 0 点赞 0 评论 54 浏览
直逼DeepSeek-R1-32B,碾压李飞飞s1-32B:UC伯克利等开源全新SOTA推理模型 本文详细介绍了由斯坦福、UC伯克利等机构联合发布的全新开源推理模型OpenThinker-32B,分析了其性能优势和技术特点,并探讨了其在实际应用中的潜力及未来发展方向。 36KR热点 2025年02月14日 12:52 0 点赞 0 评论 63 浏览
MiniMax开源M1推理模型,456B参数碾压DeepSeek-R1?技术细节曝光 MiniMax发布并开源首个大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1,支持100万token上下文输入,训练成本仅53万美元。 36KR热点 2025年06月18日 11:23 0 点赞 0 评论 45 浏览
深度解析Meta发布的Llama 4大模型:技术革新与未来展望 作为一名AI行业的观察者,他深入分析了Meta发布的Llama 4大模型。从技术革新到商业化探索,再到未来展望,他揭示了这款模型的潜力与挑战。他认为Llama 4虽然在某些方面存在不足,但其技术创新和商业化策略为未来发展提供了广阔空间。 知乎热点 2025年04月06日 12:42 0 点赞 0 评论 41 浏览
OpenAI被DeepSeek逼到墙角?一场AI领域的无声较量 本文探讨了全球AI领域因DeepSeek崛起而引发的竞争格局变化,分析了OpenAI与DeepSeek在技术、成本及市场策略上的差异,并展望了未来AI行业的发展趋势。 贴吧热点 2025年02月16日 17:41 0 点赞 0 评论 55 浏览
震惊!谷歌开源史上最小Gemma 3,手机轻松运行,超省电 昨天,谷歌发布了史上最小的Gemma 3开源模型,仅有2.7亿个参数。它以特定任务微调为目标,具备强大指令跟踪和文本能力,在手机上能轻松运行,进行25次对话耗电不到1%,非常省电。 36KR热点 2025年08月16日 16:20 0 点赞 0 评论 31 浏览
Meta发布Llama 4,实际体验如何? 作为一名开发者,他深入体验了Meta最新发布的Llama 4大语言模型。从MOE架构的应用到实际操作中的优缺点,再到对未来发展的展望,他的分享为我们揭示了这款开源模型的真实面貌。 知乎热点 2025年04月06日 13:37 0 点赞 0 评论 46 浏览