当前位置：首页 » 资讯 » 新科技 » 正文

Meta 推出 Llama 3.2 1B/3B 模型量化版，功耗更低

IP属地北京 编辑：胡颖 IT之家 时间：2024-10-27 14:21:19

10 月 27 日消息，继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。
注：模型量化（Model Quantization）就是通过各种训练方式将浮点模型转为定点模型，可以压缩模型参数，降低模型的复杂性，以便于在更轻量的平台运行。
meta 表示，他们采用了量化感知训练（Quantization-Aware Training，QAT）和后训练量化（SpinQuant）两种方法对模型进行量化，其中“量化感知训练”更重视模型的准确性，而“后训练量化”更强调模型的可移植性。
据介绍，研究人员一共为 Llama 3.2 的 1B 和 3B 模型各推出了两款量化版本，分别为 Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA 和 Llama 3.2 3B SpinQuant。
meta 声称，这些量化模型比非量化的 Llama BF16 模型速度更快，占用更少的 RAM，并且功耗更低，同时保持与 Llama BF16 版本几乎相同的精度。
尽管量化后的 Llama 3.2 1B 和 3B 模型仅支持 8000 个 Token 的上下文（原版模型支持 12.8 万个 Token），但 meta 的测试发现，无论是 Llama QLoRA 还是 Llama SpinQuant 等量化版本的基准测试结果实际上与原来的 Llama BF16 版本相差不远。
目前，meta 已在一加 12、三星 S24+/S22 及苹果 iOS 设备（未公布具体型号）等移动平台测试这些经过量化后模型，测试“运行结果良好”，研究人员未来还计划通过神经处理单元（NPU）提升这些量化模型的性能。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

宝马携超30款车型亮相上海车展新世代驾趣概念车全球首发

太极集团业绩崩盘，新董事长俞敏上任不足半年

新董事长杨秀明年度业绩首秀，重庆银行“增量不增质”？

新奥能源拟私有化，现有股东如何获利？

联想集团2025/26财年誓师大会顺利举行

谷歌计划将Gemini引入Chrome浏览器侧边栏

科技巨头与航天企业因卫星频谱资源展开法律争夺战

日料品类发展报告2025：品类持续回暖，细分赛道显现新潜力

KTC 5K 双模果粉屏显示器 H27P3 发布，3599 元

高通小至尊版芯片！REDMI首发骁龙8s Gen4

摩根士丹利基金管理公司注册资本增至9.5亿

官方媒体为哪吒之魔童闹海加油助威：全球票房近155亿

谁在悄悄打开男性消费者的钱包

宏碁掠夺者存储推出 M.2 PCIe 4.0 固态硬盘 GM6，采用 QLC 颗粒

东盟创新合作发展论坛在京举行中关村发展集团联合多方共建创新合作新生态

李杰换上一加13T：年度小屏旗舰性能/续航均是行业最强

中信消费金融公司注册资本增至10亿

山灵 SMT1.3 台式流媒体转盘上市：双频 WiFi6 传输，4798 元

OPPO Find X8s落樱粉官图公布：1.25mm全球最窄边女生一见倾心

华电国际、中国康富投资成立能源新公司

乘客“开门杀”致人死亡：网约车司机被判主责，获有期徒刑一年

7300mAh续航灭霸！vivo Y300 Pro+发布：1799元起

多瑞医药等在北京成立医疗器械公司

美的集团回应清仓小米：正常投资操作，没有什么特别原因

美的回应彻底清仓小米：公司正常投资操作

曾遭央视“3·15”晚会曝光的这家公司，2024年预亏3800万

家电消费市场持续回暖消费者购买以旧换新家电近9000万台

全站最新

上汽华为一相逢，便胜却人间无数

全民智驾时代之下，好“芯”是成败关键

苦不堪言！这就是盲目跟风“新能源车”的后果，无数人还在被误导

买新能源车，是选有“油箱”的好，还是没有的强？答案来了！

不到20万买华为三激光雷达智驾，极狐阿尔法新6系上市

低调背后的“真质战略”，北京现代首款纯电平台SUV谍照曝光

中国充电模块产业2025：300万台需求爆发，技术革新引领行业变革

比亚迪汉L即将上市，豪华配置与强劲动力能否超越小米SU7？

热门推荐

火石会48小时奇迹：140位产业巨头共筑AI“星河舰队”

AI时代新坐标！火石会：应时而生，聚势而为

宝马携超30款车型亮相上海车展新世代驾趣概念车全球首发

太极集团业绩崩盘，新董事长俞敏上任不足半年

新董事长杨秀明年度业绩首秀，重庆银行“增量不增质”？

新奥能源拟私有化，现有股东如何获利？

联想集团2025/26财年誓师大会顺利举行

谷歌计划将Gemini引入Chrome浏览器侧边栏

科技巨头与航天企业因卫星频谱资源展开法律争夺战

日料品类发展报告2025：品类持续回暖，细分赛道显现新潜力

KTC 5K 双模果粉屏显示器 H27P3 发布，3599 元

高通小至尊版芯片！REDMI首发骁龙8s Gen4

摩根士丹利基金管理公司注册资本增至9.5亿

官方媒体为哪吒之魔童闹海加油助威：全球票房近155亿

谁在悄悄打开男性消费者的钱包