杨植麟和梁文锋论文“撞车”

2月18日,DeepSeek发布新论文,介绍原生稀疏注意力(NSA)技术,大幅提升长文本处理速度,最高达11.6倍,并在基准测试中超越传统全注意力模型。创始人梁文锋亲自提交论文。同日,月之暗面创始人杨植麟也发布论文,提出块注意力混合(MoBA),允许模型在全注意力和稀疏注意力间切换。DeepSeek的崛起使其在AI领域迅速崭露头角,给月之暗面带来巨大压力。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...