当前位置：首页 » 资讯 » 新科技 » 正文

美团开源满血DeepSeek量化版？造福老显卡

IP属地北京 编辑：江紫萱中关村在线 时间：2025-03-08 19:32:50

2025-03-08 18:50:19 作者：八月八
美团技术团队近日宣布，对DeepSeek R1模型进行了INT8精度量化，使得该模型能够在老型号GPU如A100上进行部署。原生的DeepSeek R1模型权重采用FP8数据格式，这限制了其只能在英伟达的新型GPU上部署，而其他型号的GPU则无法直接支持。
为了解决这个问题，美团搜索和推荐平台部门尝试了对DeepSeek R1模型进行INT8精度量化。结果显示，量化后的模型精度基本保持不变。通过INT8量化，DeepSeek R1突破了芯片限制，现在可以部署在A100等GPU上。此外，与BF16相比，INT8量化还实现了50%的吞吐量提升，从而降低了推理成本。
现在，INT8量化代码已经发布在开源LLM推理框架SGLang上，量化模型也已发布至Hugging Face社区，以下是模型链接：
https://huggingface.co/meituan/DeepSeek-R1-Block-INT8
https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

阿里AI旗舰应用夸克全面升级，开启“AI超级框”新时代！

微信官方：超过 1/4 用户置顶“文件传输助手”

国产肉鸽射击爽游！腾讯《矩阵：零日危机》正式开测：GTX 1650就能玩

SU7 Ultra电车哪来的声浪小米：特调音效还有外放喇叭

支持麒麟990、龙芯3A6000等！银河麒麟桌面操作系统V10 SP1顺利过测

技嘉B860M AORUS ELITE WIFI 6E ICE冰雕：酷睿Ultra处理器的黄金拍档

量子密话首款千元手机发布！再不怕通话被窃听

大模型浪潮下迎算力巨变，上海芯片企业争做AI“潮人”

美国宣布：明日发射飞船接滞留太空9个月美宇航员回来

董明珠：格力空气能热水器水电分离永远不会发生电死人事故

汽车、空调表现优秀！卢伟冰：小米任何产品不能有质量问题永远质量第一

吵翻！董明珠痛斥某科技企业在做流氓行为：友商神回应字字扎心

一天暴涨170倍！再现暴富神话！

初创公司推出 Command A 模型，号称两块英伟达 A100 可部署

吵翻！董明珠痛斥某科技企业在做流氓行为：友商神回应字字扎心

深圳发布网络直播诚信倡议书：主动标识AI生成内容

斗鱼创新业务连续增长，2025年将依托AI技术驱动效率提升

读懂IPO|海阳科技全民改制隐忧：股权分散暗藏内斗风险，百名历史股东存退股争议

京东超市「科学体重管理计划」专属会场上线低GI、低卡食饮5折起助力健康生活

「新商DOU来赚」优秀案例合集：三步实现新商好生意

神策数据接入 DeepSeek，AI 赋能数据分析与智能运营

鸿蒙游戏开发者服务升级，助力游戏拓展鸿蒙新市场

全链路赋能游戏鸿蒙化适配，鸿蒙游戏开发者服务焕新升级

如鸢玩家自发辟谣，集体“反套路”引关注

同档首发墨晶屏 Vidda发现X 26款极致黑QD-Mini LED电视预售

行业首款1.3倍光学变焦4K三色激光投影Vidda M2 Pro正式发布

《闪电新品超级现场》重磅发布海尔小红花系列家电新品京东全网首发

全站最新

长安欧尚520换电轿车亮相，宁德时代助力两分钟满电续航515公里

比亚迪海洋网全系智驾车型南京上市，宋PLUS智驾版、海豹06DM-i智驾版实测

最大续航520km！比亚迪海狮 05有望于2025年4月亮相

理想 i8、i6 上市倒计时，纯电「背水一战」已经打响

小鹏新车大爆发！G6、G9改款来袭，增程G01、飞行汽车你期待哪款？

理想汽车李想：纯电SUV双箭齐发，2025年战略转型加速跑！

阿里AI旗舰应用夸克全面升级，开启“AI超级框”新时代！

微信官方：超过 1/4 用户置顶“文件传输助手”

热门推荐

阿里AI旗舰应用夸克全面升级，开启“AI超级框”新时代！

微信官方：超过 1/4 用户置顶“文件传输助手”

国产肉鸽射击爽游！腾讯《矩阵：零日危机》正式开测：GTX 1650就能玩

SU7 Ultra电车哪来的声浪小米：特调音效还有外放喇叭

支持麒麟990、龙芯3A6000等！银河麒麟桌面操作系统V10 SP1顺利过测

技嘉B860M AORUS ELITE WIFI 6E ICE冰雕：酷睿Ultra处理器的黄金拍档

量子密话首款千元手机发布！再不怕通话被窃听

大模型浪潮下迎算力巨变，上海芯片企业争做AI“潮人”

美国宣布：明日发射飞船接滞留太空9个月美宇航员回来

董明珠：格力空气能热水器水电分离永远不会发生电死人事故

汽车、空调表现优秀！卢伟冰：小米任何产品不能有质量问题永远质量第一

吵翻！董明珠痛斥某科技企业在做流氓行为：友商神回应字字扎心

一天暴涨170倍！再现暴富神话！

初创公司推出 Command A 模型，号称两块英伟达 A100 可部署

吵翻！董明珠痛斥某科技企业在做流氓行为：友商神回应字字扎心