机器学习

DeepSeek NSA技术:低成本高效率的AI推理革命

DeepSeek推出的NSA技术是一种硬件对齐且原生可训练的稀疏注意力机制,专为超快速长上下文训练与推理设计。该技术通过动态分层稀疏策略、粗粒度token压缩和细粒度token选择等核心组件,在降低成本的同时保持高性能,为AI领域带来了一场真正的降本增效革命。

机器学习中那些简单却巧妙的idea

本文从个人视角出发,分享了机器学习中一些简单却巧妙的idea,包括卷积神经网络的局部连接特性、决策树的优化技巧、K-均值聚类的实现、线性回归的应用以及特征选择的方法。

2025,AI搜索要搞大事情

本文从个人视角出发,讲述了2025年AI搜索领域的重大变革及其对日常生活的影响,探讨了技术进步背后的社会责任。