DeepSeek下一代技术提前曝光，梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上，由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。他们提出的原生稀疏注意力（NSA）机制，通过算法与硬件的协同优化，直接把长文本处理速度提升了11倍。更厉害的是，性能不仅没降反而还超越了传统的全注意力模型。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

一作袁境阳在会上发表演讲，透露这项技术可以把上下文长度扩展到1百万tokens，将被应用到下一个前沿模型中。

结合论文发表于DeepSeek-R1推出之后，实验设置中也提到使用了DeepSeek-R1的蒸馏数据来微调了新的模型。

大家纷纷猜测，这项技术将被用于下一代DeepSeek-V4以及DeepSeek-R2。（量子位）

风险提示及免责条款