头条热点

揭秘DeepSeek提及的FP8:下一代国产芯片的秘密武器?

最近,DeepSeek在其最新版本DeepSeek - V3.1中提到的FP8引起了广泛关注。FP8是一种低精度数字格式,它在DeepSeek - V3的训练中被用于混合精度计算,能减少计算量和内存占用,加快训练速度并节省能源。FP8混合精度训练技术还有许多优势,如细粒度量化策略、低精度优化器状态等。这对DeepSeek的性能提升有很大帮助,也让我们对下一代国产芯片充满期待。