机器学习

机器学习中那些简单却巧妙的idea

本文从个人视角出发,分享了机器学习中一些简单却巧妙的idea,包括卷积神经网络的局部连接特性、决策树的优化技巧、K-均值聚类的实现、线性回归的应用以及特征选择的方法。

DeepSeek NSA技术:低成本高效率的AI推理革命

DeepSeek推出的NSA技术是一种硬件对齐且原生可训练的稀疏注意力机制,专为超快速长上下文训练与推理设计。该技术通过动态分层稀疏策略、粗粒度token压缩和细粒度token选择等核心组件,在降低成本的同时保持高性能,为AI领域带来了一场真正的降本增效革命。