优质赞助商

大额流量卡免费领取

清华团队突破大模型算力难题

80 00

2月10日，清华大学KVCache.AI团队与趋境科技联合发布的KTransformers开源项目迎来重大更新，成功打破大模型推理算力门槛。此次更新支持在24G显存的设备上本地运行671B参数的DeepSeek-R1满血版，预处理速度达286 tokens/s，推理速度最高14 tokens/s。项目整合Intel AMX指令集，提升CPU预填充速度，兼容Hugginface Transformers API与ChatGPT式Web界面，极大降低上手难度。

热搜 # DeepSeek R1 # KTransformers # 显存优化 # 本地运行 # 模板注入框架

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

巴菲特股东大会二十大要点

巴菲特股东大会二十大要点

热搜 # 伯克希尔哈撒韦 # 巴菲特 # 股东大会

cbaurl

0740

斯诺克世锦赛中国军团三人通过首轮

斯诺克世锦赛中国军团三人通过首轮

热搜 # 世锦赛 # 中国球员 # 斯诺克

cbaurl

0650

第一批外国人已经出发来中国了

第一批外国人已经出发来中国了

热搜 # 中国菜 # 免签政策 # 入境游

cbaurl

0650

汪东城和哪吒适配度

汪东城和哪吒适配度

热搜 # COSPLAY # 债务 # 催婚

cbaurl

0570

暂无评论

您必须登录才能参与评论！

none

暂无评论...