微软Phi-4封神:14B小模型数学击败GPT-4o,合成数据占比40%,36页技术报告出炉 微软推出的14B参数小型语言模型Phi-4在数学推理方面表现出色,超越多个更大规模的模型,如70B的Llama 3.3和72B的Qwen。 Phi-4使用40%合成数据进行训练,并发布了详细的36页技术报告。 36KR热点 2024年12月23日 14:17 0 点赞 0 评论 80 浏览
一次搭建胜过亿次编码:MCP与Anthropic协议如何定义AI智能体未来 本文深入探讨了Manus智能体及其背后的MCP与Anthropic协议,分析了这些技术如何通过降低成本和提高效率来推动AI行业发展,并展望了未来的发展趋势。 36KR热点 2025年03月11日 12:52 0 点赞 0 评论 52 浏览
OpenAI发布o3思维链,网友热议:感谢DeepSeek带来的挑战 文章详细介绍了OpenAI最新发布的o3思维链模型及其背后的故事,并探讨了网友对此事的看法以及对未来AI发展的展望。 36KR热点 2025年02月07日 11:50 0 点赞 0 评论 59 浏览
OpenAI预告GPT-5发布时间!奥特曼承诺将远超预期 作为一名关注AI领域的观察者,他发现OpenAI近期宣布的GPT-5发布计划引发了广泛讨论。从免费开放策略到技术创新亮点,每一个细节都让人充满期待。他深入分析了GPT-5可能带来的变革,并探讨了其对未来的深远影响。 36KR热点 2025年04月05日 14:55 0 点赞 0 评论 46 浏览
DeepSeek NSA技术:低成本高效率的AI推理革命 DeepSeek推出的NSA技术是一种硬件对齐且原生可训练的稀疏注意力机制,专为超快速长上下文训练与推理设计。该技术通过动态分层稀疏策略、粗粒度token压缩和细粒度token选择等核心组件,在降低成本的同时保持高性能,为AI领域带来了一场真正的降本增效革命。 IT热点 2025年02月19日 05:23 0 点赞 0 评论 63 浏览
博弈论入门:当博弈论遇上机器学习 本文从个人视角出发,探讨了博弈论与机器学习的结合,介绍了博弈论在支持向量机(SVM)、生成对抗网络(GAN)和强化学习中的应用,并展望了未来的发展方向。 简书热点 2024年12月04日 02:20 0 点赞 0 评论 72 浏览
智能合约2.0来袭:AI自主编写+执行,颠覆传统逻辑|我亲历的未来契约革命 作者分享了近期接触PaperCoder框架的经历,探讨了AI智能体生态的发展趋势,介绍了Kimi开源视觉模型的技术亮点,并展望了IT3.0时代的人机物三元融合前景。 简书热点 2025年05月03日 15:37 0 点赞 0 评论 39 浏览
Claude 3.7 Sonnet:AI领域的又一里程碑,如何看待其潜力与挑战? Claude 3.7 Sonnet是Anthropic推出的全新混合推理模型,本文从技术亮点、市场表现、经济成本及未来展望等多个角度进行深度剖析,探讨其潜力与挑战。 知乎热点 2025年02月25日 11:37 0 点赞 0 评论 40 浏览
LSTM之父的惊人声明:1991年我就提出了线性自注意力机制,领先Transformer 26年 LSTM之父Jürgen在报告中指出,他在1991年就已经提出了线性自注意力机制,这一发现比Transformer早了26年。本文将带你深入了解这一惊人的历史,并探讨其对未来AI发展的影响。 36KR热点 2024年12月14日 10:26 0 点赞 0 评论 73 浏览
牛津教授的惊人预言:AI将超越人类科研速度500倍,真相究竟如何? 作为一名关注前沿科技动态的人,我最近了解到牛津大学一位教授提出了一个惊人的预言:未来十年内,AI可能完成相当于人类100年的科学发现,其科研效率更是超过了人类500倍。这让我深感震撼,同时也引发了我对AI未来发展潜力及其可能带来影响的思考。 36KR热点 2025年03月26日 21:46 0 点赞 0 评论 61 浏览