梁文锋带实习生发论文

梁文锋带实习生发论文

2月18日,DeepSeek和月之暗面分别发布论文,挑战Transformer架构的注意力机制。DeepSeek的NSA(原生稀疏注意力)技术通过动态分层稀疏策略、硬件优化等手段,大幅提升长文本处理效...
2个月前
050
DeepSeek梁文锋谈选人标准

DeepSeek梁文锋谈选人标准

DeepSeek,一家中国新兴公司,凭借过硬的原始创新能力和独特的组织文化,在大模型领域超越了国内外诸多科技巨头。创始人梁文锋强调好奇心驱动和自由探索,团队以应届毕业生为主,通过减少管理干预和鼓励试错...
2个月前
090