当前位置：首页 » 资讯 » 新科技 » 正文

技术奇迹！清华突破大模型算力难题 RTX 4090单枪匹马就能跑满血版DeepSeek

IP属地北京 编辑：顾雨柔快科技 时间：2025-02-15 18:32:32

2月15日消息，清华团队突破大模型算力难题，这让英伟达情何以堪。
据国内媒体报道称，清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新，成功打破大模型推理算力门槛。
此次KTransformers项目更新带来重大突破，支持在24G显存（4090D）的设备上本地运行DeepSeek-R1、V3的671B满血版。
KTransformers项目的核心在于异构计算策略：稀疏性利用：MoE架构每次仅激活部分专家模块，团队将非共享的稀疏矩阵卸载至CPU内存，结合高速算子处理，显存占用压缩至24GB。
量化与算子优化：采用4bit量化技术，配合Marlin GPU算子，效率提升3.87倍；CPU端通过llamafile实现多线程并行，预处理速度高达286 tokens/s。
CUDA Graph加速：减少CPU/GPU通信开销，单次解码仅需一次完整的CUDA Graph调用，生成速度达14 tokens/s。
这带来了怎样的后果呢？传统方案：8卡A100服务器成本超百万，按需计费每小时数千元。
现在，单卡RTX 4090方案：整机成本约2万元，功耗80W，适合中小团队与个人开发者。
NVIDIA RTX 4090运行DeepSeek-R1满血版的案例，不仅是技术奇迹，更是开源精神与硬件潜能结合的典范。它证明：在AI狂飙的时代，创新往往源于对“不可能”的挑战。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

为什么微信总部在广州，却不是在深圳腾讯总部？

蓝宝石推出 NiTRO+ B850M WiFi 主板，899 元

百度目前无法被deepseek代替

华为最强手机屏幕！曝Pura 80系列升级双层OLED

百度目前无法被deepseek代替

高情商：《天国：拯救2》称其优化出色要归功于微软Xbox Series S

华为最强小折叠！曝华为Pocket 3最快3月登场

小米影像之王！小米15 Ultra两大长焦敲定

开发商解散后，索尼《星鸣特攻》三位高级员工加盟《光环》工作室

微信已接入DeepSeek-R1模型

系列最强机预定！郭明錤预估iPhone SE 4今年出货近2000万台

亚冬会期间，入境宾客用支付宝消费同比增长近六倍

百度转向开源路线，李彦宏“顺势而为”

字节CEO全员会反思DeepSeek影响：跟进速度还不够

比亚迪宋家族 2024年中国SUV销冠

文心一言免费后还要开源下一代模型，百度在下一盘大棋

“赌王”之女何超琼的生意版图：美高梅中国去年收益净额40亿美元，低调布局内地

专访MOVA割草机器人CTO秦岭：智能化的本质是“解放双手”

消息称微信正在内测接入 DeepSeek-R1 大模型

第三方开发者立功，索尼PSP发布20年后终于支持WPA2加密Wi-Fi

Meta下一个重大押注：AI人形机器人

字节CEO全员会反思DeepSeek影响：跟进速度还不够

死磕研发！雷军：小米5年投入1050亿元 2025年预投入300亿

卢伟冰看完小米15 Ultra发布会PPT：直呼内容太多了需要删减

阿里拐点将至？

自研基带的iPhone SE 4计划今年出货2000万台，高通坐不住了

小米「超级小爱」默默接入DeepSeek后，又悄悄下线了

全站最新

为什么微信总部在广州，却不是在深圳腾讯总部？

蓝宝石推出 NiTRO+ B850M WiFi 主板，899 元

吉利银河L9大六座SUV曝光，内饰借鉴领克900，年内上市引期待

【国内新车】宝马X3长轴距版全球首发！中国市场专属，更宽敞、更强悍！

国产电车少人买了，燃油车大举反攻，外资车成为赢家

高人预测，若不出意外，未来5年的楼市或将发生4大转变，个个扎心

太原：火了消费热了古街

小M助手：商家的流量“破冰船”

热门推荐

为什么微信总部在广州，却不是在深圳腾讯总部？

蓝宝石推出 NiTRO+ B850M WiFi 主板，899 元

百度目前无法被deepseek代替

华为最强手机屏幕！曝Pura 80系列升级双层OLED

百度目前无法被deepseek代替

高情商：《天国：拯救2》称其优化出色要归功于微软Xbox Series S

华为最强小折叠！曝华为Pocket 3最快3月登场

小米影像之王！小米15 Ultra两大长焦敲定

开发商解散后，索尼《星鸣特攻》三位高级员工加盟《光环》工作室

微信已接入DeepSeek-R1模型

系列最强机预定！郭明錤预估iPhone SE 4今年出货近2000万台

亚冬会期间，入境宾客用支付宝消费同比增长近六倍

百度转向开源路线，李彦宏“顺势而为”

字节CEO全员会反思DeepSeek影响：跟进速度还不够

比亚迪宋家族 2024年中国SUV销冠