当前位置：首页 » 资讯 » 新科技 » 正文

谷歌推出 AI 架构 Transformer 新方法：突破长文本处理，

IP属地北京 编辑：刘敏 IT之家 时间：2024-10-09 11:10:25

10 月 9 日消息，科技媒体 marktechpost 昨日（10 月 8 日）发布博文，报道称谷歌公司推出了选择性注意力（Selective Attention）方法，可以提高 Transformer 架构模型的性能。
Transformer 架构简介
Transformer 是一种革命性的神经网络架构，由谷歌在 2017 年提出，主要用于处理序列数据，特别是在自然语言处理（NLP）领域。
Transformer 的核心是自注意力机制，允许模型在处理输入序列时捕捉词与词之间的关系，让模型能够关注输入序列中的所有部分，而不仅仅是局部信息。
Transformer 由多个编码器和解码器组成。编码器负责理解输入数据，而解码器则生成输出。多头自注意力机制使模型能够并行处理信息，提高了效率和准确性。
Transformer 架构模型挑战
Transformer 架构的一大挑战是它们在处理长文本序列时效率低下，由于每个标记与序列中的每个其他标记都相互作用导致二次复杂度，这就导致随着上下文长度的增加，计算和内存需求呈指数增长。
现在解决这一问题的方法包括稀疏注意力机制（sparse attention mechanisms），它限制了标记之间的交互数量，以及通过总结过去信息来减少序列长度的上下文压缩技术。
不过这种方法是通过减少在注意力机制中考虑的标记数量达成的，因此通常以性能为代价，可能会导致上下文关键信息丢失。
谷歌新方法
谷歌研究的研究人员提出了一种名为选择性注意的新方法，可以动态忽略不再相关的标记，从而提高 Transformer 模型的效率。
选择性注意力使用软掩码矩阵来确定每个标记对未来标记的重要性，减少对不重要标记的关注。
研究表明，配备选择性注意的 Transformer 架构模型在多个自然语言处理任务中表现出色，同时显著降低了内存使用和计算成本。
例如，在拥有 1 亿参数的 Transformer 模型中，注意力模块的内存需求在上下文大小为 512、1024 和 2048 个 tokens 时分别减少至 1/16、1/25 和 1/47。所提方法在 HellaSwag 基准测试中也优于传统 Transformer，对于较大的模型规模实现了高达 5% 的准确率提升。
选择性注意力允许构建更小、更高效的模型，在不损害准确性的情况下，显著减少内存需求。
附上参考地址

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

国家电网：我国高速公路服务区累计建成充电桩 2.88 万个

FF获赠「成长吧！奋斗者」公司10%股份

互联互通更深入！微信端能直接用淘宝了：直接下单支持账号绑定

创意满点！《模拟山羊3》将于10月24登陆PS4/Xbox One

马特达蒙有望加盟诺兰新片起初计划明年夏天上映

任天堂股价遭减持！沙特基金逐步退出投资

vivo X200首发！一图看懂联发科天玑9400：300万跑分刷新安卓极限

车圈最强！联发科全球首发3nm旗舰汽车座舱芯片CT-X1：性能超高通骁龙8295 30%

OpenAI融资66亿美元终成千亿独角兽

24年来首次！美国考虑强制拆分谷歌：强迫出售部分业务

贾跃亭将“成长吧！奋斗者”公司 10% 股份赠予法拉第未来

荣耀X60系列10月16日来袭：首次搭载卫星通信技术，科技普惠升级

在地化拯救不了高星酒店

十一跟团旅游的年轻人，跟完就后悔了

AI悄然高筑了人与人之间的“柏林墙”

米哈游再启动

五个月狂吸300万美金，产品总收入超6亿，这家乌克兰公司把互动短剧和AI陪伴一起打通了？

国庆后第二个交易日：股市低开，多家上市公司“套现”，股东7.4折“跑路”

6499元华硕破晓6 Pro轻薄笔记本上市：酷睿Ultra 5 228V配双雷电4

数字政通“麒舰”平台正式官宣！全面支持华为纯血鸿蒙操作系统

建仓了！首批10只中证A500ETF净值亮相，200亿增量资金陆续入市

李大霄：A股调整已经到位！这是一场中国核心资产重心上移的牛市，投资者不应被短期波动所吓倒

“十一”租车市场火爆！有平台新能源车订单增长72%，2030年行业规模或可达3000亿元

国内首艘！我国大型压裂船主动力发电机组交付：总功率30000KW

vivo X200系列官宣：全球首发蓝晶×天玑9400 全大核3nm旗舰芯！

手机享受PC级游戏体验！联发科天玑9400旗舰GPU性能暴增41%

249元！米家多功能电火锅6L众筹开启：2000W大火力+分体式锅体

全站最新

“三号”收官下一代北斗还远吗

欧盟对中国电动车加征关税再起风云

国家电网：我国高速公路服务区累计建成充电桩 2.88 万个

FF获赠「成长吧！奋斗者」公司10%股份

移动支付促国庆旅游消费热入境游客用支付宝消费同比增长120%

互联互通更深入！微信端能直接用淘宝了：直接下单支持账号绑定

创意满点！《模拟山羊3》将于10月24登陆PS4/Xbox One

马特达蒙有望加盟诺兰新片起初计划明年夏天上映

热门推荐

国家电网：我国高速公路服务区累计建成充电桩 2.88 万个

FF获赠「成长吧！奋斗者」公司10%股份

互联互通更深入！微信端能直接用淘宝了：直接下单支持账号绑定

创意满点！《模拟山羊3》将于10月24登陆PS4/Xbox One

马特达蒙有望加盟诺兰新片起初计划明年夏天上映

任天堂股价遭减持！沙特基金逐步退出投资

vivo X200首发！一图看懂联发科天玑9400：300万跑分刷新安卓极限

车圈最强！联发科全球首发3nm旗舰汽车座舱芯片CT-X1：性能超高通骁龙8295 30%

OpenAI融资66亿美元终成千亿独角兽

24年来首次！美国考虑强制拆分谷歌：强迫出售部分业务

贾跃亭将“成长吧！奋斗者”公司 10% 股份赠予法拉第未来

荣耀X60系列10月16日来袭：首次搭载卫星通信技术，科技普惠升级

在地化拯救不了高星酒店

十一跟团旅游的年轻人，跟完就后悔了

AI悄然高筑了人与人之间的“柏林墙”