当前位置：首页 » 资讯 » 新科技 » 正文

苹果、英伟达强强联手，LLM 推理加速利器 ReDrafter 开源

IP属地北京 编辑：江紫萱 IT之家 时间：2024-12-19 09:39:23

12 月 19 日消息，苹果公司昨日（12 月 18 日）发布博文，宣布和英伟达（Nvidia）合作，通过开源 Recurrent Drafter（ReDrafter）推测解码方法，显著提升了 AI 大语言模型（LLM）的推理速度。
苹果公司表示 ReDrafter 已集成到 NVIDIA TensorRT-LLM 推理加速框架中，在 NVIDIA GPU 上，每秒生成 tokens 速度最高提升 2.7 倍，有效降低了用户延迟和计算成本。
苹果的机器学习研究人员指出，LLM 越来越多地用于驱动生产应用程序，提高推理效率对降低计算成本和用户延迟至关重要。
援引苹果官方博文，ReDrafter 使用 RNN 草稿模型，结合波束搜索（beam search）与动态树注意力（dynamic tree attention），可以让开源模型每步生成最多 3.5 个 tokens，超越了先前推测性解码技术的性能。
为将 ReDrafter 应用于生产环境，苹果与 NVIDIA 展开合作，将其集成到 NVIDIA TensorRT-LLM 框架中。
英伟达为此添加了新的运算符并公开了现有运算符，增强了 TensorRT-LLM 对复杂模型和解码方法的适应性。
基准测试结果显示，在 NVIDIA GPU 上使用集成了 ReDrafter 的 TensorRT-LLM 框架，数百亿参数规模的生产模型的解码速度提升了 2.7 倍。这不仅降低了用户体验延迟，还减少了 GPU 使用数量和功耗。
附上参考地址

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

Windows 11增加两个新广告！微软：那是通知

3GPP 无线接入网首个 6G 标准项目通过

Intel显卡成了！二代锐炫B580需求飙升：海外电商平台几乎全售罄

13代酷睿身披马甲再战！Intel正式发布酷睿200H系列

鹏城原生力量，2024鲲鹏原生开发伙伴圈层活动·深圳站成功举办

京东服饰携手国货品牌发起“熊猫守望者关爱计划” 守护一线巡护员冬季健康

余承东牛！小米SU7创造的一项纪录，被华为智界R7打破了

朱珠与荣耀Magic7 RSR 保时捷设计同框：美到溢出屏幕

OPPO布局AI新动态，入股人工智能公司波形智能

华为Mate 70预估销量突破千万台

鸿海旗下元富科技推出 AFOX RTX 4070 Ti / SUPER 显卡，采用涡轮散热设计

Switch美国销量超越PS2！仅次于任天堂自家的NDS

国外数据网站：Switch在美销量超过PS2

Mate 70被疯抢！中国市场手机激活量最新排名：华为拿下第一

添田武人感谢玩家：10年是我们共同走出的路

聚焦打造智能制造升级版 2024世界智能制造大会即将在宁举行

见证中国智造，爱玛A7Plus“一路超神”推动行业高质量发展

《听见，看见：汉字里的中国文化》在重庆开幕带上耳朵听方言

消息称微信内测新功能：朋友圈支持图片回复

两名百万网红偷税近千万！柏公子大搞“阴阳合同”，厦门小程三年个税申报未达起征点

柔宇名下资产首拍流拍此前因无法还债被宣告破产

三星曲面屏新专利曝光：密封技术升级设备结构增强

通用大模型合规管理体系指南；AIGC服务安全应急响应指南

聚智海洋共铸未来第三届海事互联网大会圆满举行

火山引擎总裁谭待：AI对话很基础，视觉能解锁更多复杂任务

网易游戏，苦熬十二月

中国轻户外消费研究：卷功能的3500亿童装下一个新风口在哪？

全站最新

Windows 11增加两个新广告！微软：那是通知

3GPP 无线接入网首个 6G 标准项目通过

Intel显卡成了！二代锐炫B580需求飙升：海外电商平台几乎全售罄

13代酷睿身披马甲再战！Intel正式发布酷睿200H系列

鹏城原生力量，2024鲲鹏原生开发伙伴圈层活动·深圳站成功举办

京东服饰携手国货品牌发起“熊猫守望者关爱计划” 守护一线巡护员冬季健康

汽车保值率猛跌，TA为何成保值范本？

余承东牛！小米SU7创造的一项纪录，被华为智界R7打破了

热门推荐

Windows 11增加两个新广告！微软：那是通知

3GPP 无线接入网首个 6G 标准项目通过

Intel显卡成了！二代锐炫B580需求飙升：海外电商平台几乎全售罄

13代酷睿身披马甲再战！Intel正式发布酷睿200H系列

鹏城原生力量，2024鲲鹏原生开发伙伴圈层活动·深圳站成功举办

京东服饰携手国货品牌发起“熊猫守望者关爱计划” 守护一线巡护员冬季健康

余承东牛！小米SU7创造的一项纪录，被华为智界R7打破了

朱珠与荣耀Magic7 RSR 保时捷设计同框：美到溢出屏幕

OPPO布局AI新动态，入股人工智能公司波形智能

华为Mate 70预估销量突破千万台

鸿海旗下元富科技推出 AFOX RTX 4070 Ti / SUPER 显卡，采用涡轮散热设计

Switch美国销量超越PS2！仅次于任天堂自家的NDS

国外数据网站：Switch在美销量超过PS2

Mate 70被疯抢！中国市场手机激活量最新排名：华为拿下第一

添田武人感谢玩家：10年是我们共同走出的路