深度学习 - 头条X

OpenAI o3-mini被曝大量使用中文推理，背后隐藏了什么深意？

OpenAI o3-mini-high模型被曝大量使用中文推理，引发业界热议。本文从技术背景、市场需求及行业趋势等多个角度深入解析这一现象背后的深意。

知乎热点 2025年02月08日 11:16 0 点赞 0 评论 77 浏览

10分钟搭建DeepSeek R1满血版个人知识库实例指导

本文详细介绍了如何在10分钟内利用DeepSeek R1搭建个人知识库的全过程，从云主机选购到具体配置，再到实际使用体验，全面覆盖，助力用户轻松上手。

简书热点 2025年02月25日 14:11 0 点赞 0 评论 76 浏览

如何评价 Sakana AI 推出的 AI CUDA Engineer？未来的技术革命已悄然来临

本文详细解析了Sakana AI推出的AI CUDA Engineer技术及其潜在影响，探讨了其在GPU计算领域的应用前景及对未来技术发展的推动作用。

知乎热点 2025年02月22日 16:46 0 点赞 0 评论 76 浏览

商汤联合创始人谈DeepSeek：AI技术的未来与挑战

本文以第三人的视角，通过作者的亲身经历，深入探讨了商汤联合创始人对DeepSeek的看法及AI技术的未来发展与挑战，为读者提供了全新的视角。

百度热点 2025年03月02日 02:55 0 点赞 0 评论 75 浏览

Grok3翻车了？9.11居然比9.9大，背后真相竟是这样！

Grok3大模型发布后引发热议，竟在回答“9.11是否比9.9大”时出现错误。本文从用户视角出发，探讨了这一现象背后的原因及其对人工智能发展的启示。

百度热点 2025年02月19日 15:05 0 点赞 0 评论 75 浏览

AI“脑补”成瘾，马里兰华人学霸揭秘背后真相

作为一名对AI充满兴趣的研究者，他深入剖析了AI生成内容时“胡编乱造”的原因，并结合多个案例揭示了背后的技术局限与行业现状。从Llama4的研发争议到AI创造力的边界，再到用AI训练AI的隐患，他带领读者一步步揭开AI“脑补”成瘾的内幕。

36KR热点 2025年04月15日 08:31 0 点赞 0 评论 75 浏览

Meta Llama 4震撼登场：参数减半性能翻倍，大模型时代新篇章

作为一名亲历者，他目睹了Llama 4系列的发布过程。从Scout到Maverick再到即将面世的Behemoth，每一款模型都代表着大模型技术的重大突破。尤其是参数减半却性能翻倍的设计理念，以及对H100 GPU的支持，让开发者们看到了更多可能性。同时，DeepSeek的‘代码开源周’也为行业注入了新的活力。

IT热点 2025年04月07日 22:07 0 点赞 0 评论 73 浏览

从零开始理解Transformer和BERT：小白也能看懂的AI入门指南

本文以知乎平台上的一个真实问题为核心，探讨了如何从零开始理解Transformer和BERT这两篇经典论文。文章通过详细解析基础知识、学习方法以及实际应用案例，为初学者提供了一份全面的AI入门指南。

知乎热点 2025年03月22日 05:35 0 点赞 0 评论 73 浏览

那个总站在大模型技术C位的传奇男子，究竟靠什么征服行业？

本文聚焦于大模型领域的传奇人物，从GShard到Switch Transformers，再到昆仑万维SkyReels和DeepSeek，梳理其技术创新之路。文章采用图文结合的方式，通过技术解析和案例展示，呈现这位行业领军人物如何持续站在AI技术最前沿。

36KR热点 2025年05月11日 13:10 0 点赞 0 评论 73 浏览

见证历史：两位华人坐镇Grok 3发布会C位，马斯克成“点头机器”

文章深入探讨了马斯克旗下xAI发布的Grok 3大模型发布会，特别聚焦于两位华人科学家Jimmy Ba和吴宇怀在其中的重要角色，分析了Grok 3的技术亮点及其对未来AI行业的影响。

百度热点 2025年02月19日 13:15 0 点赞 0 评论 72 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期