当前位置：首页 » 资讯 » 新科技 » 正文

谷歌 DeepMind 优化 AI 模型新思路，计算效率与推理能力兼得

IP属地北京 编辑：苏婉清 IT之家 时间：2024-12-28 10:13:35

12 月 28 日消息，谷歌 DeepMind 团队最新推出了“可微缓存增强”（Differentiable Cache Augmentation）的新方法，在不明显额外增加计算负担的情况下，可以显著提升大语言模型的推理性能。
项目背景
注：在语言处理、数学和推理领域，大型语言模型（LLMs）是解决复杂问题不可或缺的一部分。
计算技术的增强侧重于使 LLMs 能够更有效地处理数据，生成更准确且与上下文相关的响应，随着这些模型变得复杂，研究人员努力开发在固定计算预算内运行而不牺牲性能的方法。
优化 LLMs 的一大挑战是它们无法有效地跨多个任务进行推理或执行超出预训练架构的计算。
当前提高模型性能的方法涉及在任务处理期间生成中间步骤，但代价是增加延迟和计算效率低下。这种限制阻碍了他们执行复杂推理任务的能力，特别是那些需要更长的依赖关系或更高地预测准确性的任务。
项目介绍
“可微缓存增强”（Differentiable Cache Augmentation）采用一个经过训练的协处理器，通过潜在嵌入来增强 LLM 的键值（kv）缓存，丰富模型的内部记忆，关键在于保持基础 LLM 冻结，同时训练异步运行的协处理器。
整个流程分为 3 个阶段，冻结的 LLM 从输入序列生成 kv 缓存；协处理器使用可训练软令牌处理 kv 缓存，生成潜在嵌入；增强的 kv 缓存反馈到 LLM，生成更丰富的输出。
在 Gemma-2 2B 模型上进行测试，该方法在多个基准测试中取得了显著成果。例如，在 GSM8K 数据集上，准确率提高了 10.05%；在 MMLU 上，性能提升了 4.70%。此外，该方法还降低了模型在多个标记位置的困惑度。
谷歌 DeepMind 的这项研究为增强 LLMs 的推理能力提供了新的思路。通过引入外部协处理器增强 kv 缓存，研究人员在保持计算效率的同时显著提高了模型性能，为 LLMs 处理更复杂的任务铺平了道路。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

网易《实况足球 Online》游戏开启 PC 端预约

索尼SIE首席执行官谈《星鸣特攻》两周关服

全国闭店，转型失败，娃哈哈为什么玩儿不转奶茶店？|马上评

iStorage 推出全球首款通过 FIPS 140-3 Level 3 认证的闪存盘

精打细算：俄罗斯国际空间站任务拟延期1~3月，两年省出一艘飞船

蔚来，提起诉讼！

扎堆派发“红包”！A股这一板块，创十年最大年度涨幅

贺铿：发展新质生产力，我国自研之路正在打破技术封锁

“亿”路高歌猛进，雅迪携手王鹤棣开启行业年轻化新征程

来势凶猛！海信将在CES2025发布新型显示技术，瞄准QD-OLED

行业排名第一，全球氮化镓龙头英诺赛科即将登陆H股

华为之后全球第二家！三星三折叠屏曝光

小米给小米SU7车主送新年礼物：免费领四个Are you OK气门塞

2024年知行合一通信行业数据治理实践指南报告-华为云

大蓝被封了，周鸿祎又来接班了：这两个绝不是赚钱机会

鸿蒙原生版铁路 12306 已支持学生和务工人员预约春运购票

荣耀Magic7系列全面升级大王影像，AI与影像相结合是未来发展方向

我国首个海上风电机组地面试验平台投运

中国商飞：大飞机规模化系列化建设项目启动

小米SU7交付超13万，“REDMI汽车”完全没计划

iPhone 14/SE 3退环境，Type-C一统江湖

索尼第一方工作室Firesprite新作曝光，基本确认为《直到黎明 2》

荣耀 Magic7 RSR 保时捷设计手机维修备件价格公布

如何加速人工智能大模型应用场景落地？成都这场大会透露信号→

华为人形机器人概念牛股，最新透露

琼州海峡首艘新能源汽车专用运输平板船接受“体检”

宁德时代回应“明年 1 月计划减少磷酸铁锂生产”称传闻不属实

全站最新

网易《实况足球 Online》游戏开启 PC 端预约

索尼SIE首席执行官谈《星鸣特攻》两周关服

全国闭店，转型失败，娃哈哈为什么玩儿不转奶茶店？|马上评

iStorage 推出全球首款通过 FIPS 140-3 Level 3 认证的闪存盘

精打细算：俄罗斯国际空间站任务拟延期1~3月，两年省出一艘飞船

蔚来，提起诉讼！

扎堆派发“红包”！A股这一板块，创十年最大年度涨幅

贺铿：发展新质生产力，我国自研之路正在打破技术封锁

热门推荐

网易《实况足球 Online》游戏开启 PC 端预约

索尼SIE首席执行官谈《星鸣特攻》两周关服

全国闭店，转型失败，娃哈哈为什么玩儿不转奶茶店？|马上评

iStorage 推出全球首款通过 FIPS 140-3 Level 3 认证的闪存盘

精打细算：俄罗斯国际空间站任务拟延期1~3月，两年省出一艘飞船

蔚来，提起诉讼！

扎堆派发“红包”！A股这一板块，创十年最大年度涨幅

贺铿：发展新质生产力，我国自研之路正在打破技术封锁

“亿”路高歌猛进，雅迪携手王鹤棣开启行业年轻化新征程

来势凶猛！海信将在CES2025发布新型显示技术，瞄准QD-OLED

行业排名第一，全球氮化镓龙头英诺赛科即将登陆H股

华为之后全球第二家！三星三折叠屏曝光

小米给小米SU7车主送新年礼物：免费领四个Are you OK气门塞

2024年知行合一通信行业数据治理实践指南报告-华为云

大蓝被封了，周鸿祎又来接班了：这两个绝不是赚钱机会