当前位置：首页 » 资讯 » 新科技 » 正文

度小满联合哈工大创新研发SmartTrim 助推多模态在金融领域落地

IP属地北京 编辑：周琳砍柴网 时间：2024-11-18 12:15:26

如今，随着人工智能的快速发展，多模态这一技术备受行业关注。针对多模态，度小满不断加强技术创新，在该技术领域积累了丰富经验。近期，度小满联合哈工大，创新研发推出自适应剪枝算法——SmartTrim。SmartTrim可大幅提升计算效率，度小满未来将把SmartTrim整合到轩辕大模型中，以推动大模型技术的发展。
度小满研发推出自适应剪枝算法SmartTrim
在视觉语言大模型（VLM）的研究和应用中，高计算成本一直是制约其广泛部署的主要障碍。近日，哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有效削减，实现了显著的效率提升，相关研究成果已被国际自然语言处理领域顶级会议COLING 24接收。　　
据介绍，SmartTrim技术的核心在于其自适应剪枝能力，通过分析模型中每层的token表示和attention head的冗余性，智能识别并剪除不必要的计算负担。这一过程中，SmartTrim不仅考虑了token在单一模态序列中的重要性，还特别强调了跨模态交互中的关键作用。通过这种精细化的剪枝策略，SmartTrim能够在保持模型性能的同时，大幅提升计算效率。
在基于 VQA 微调的 METER 的跨模态编码器中，层内不同 token（上）和 attention head（下）表示的相似性。
SmartTrim框架的实施涉及两个关键组件：跨模态感知的Token修剪器和模态自适应的注意力头修剪器。Token修剪器利用多层感知器（MLP）结构，智能地识别并去除那些对于当前层不重要的Token。这一过程不仅考虑了Token在文本或图像序列中的独立重要性，还综合了它们在跨模态交互中的贡献。注意力头修剪器则直接集成在模型的自注意力模块中，评估并修剪那些冗余的注意力头，从而优化了模型的计算效率。
SmartTrim 框架结构图
在训练SmartTrim模型时，研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧，解决了不可导二值mask的问题，实现了模型的端到端训练。此外，自蒸馏和课程学习策略的引入，进一步提高了剪枝后模型的性能，确保了训练过程的稳定性。
Token 的逐步裁剪修剪过程
度小满在多模态大模型领域持续开展研究工作
实验结果表明，SmartTrim在METER和BLIP两个VLM上实现了2-3倍的加速，同时将性能损失最小化。这一成果不仅在理论上具有创新性，也为实际应用中的模型优化提供了新的思路。特别是在1.5倍加速比下，SmartTrim的性能甚至超过了原始模型。在高加速比下，SmartTrim相比其他方法展现出显著优势。
SmartTrim技术的推出，标志着多模态大模型研究的一个重要里程碑。度小满表示，SmartTrim技术将在未来整合到公司的轩辕大模型中，以推动大模型技术的发展。相关研究者可以通过访问了解更多关于SmartTrim的详细信息和研究成果。
度小满联合哈尔滨工业大学共同研发自适应剪枝算法——SmartTrim，为推动多模态在金融领域落地提供了全新路径。未来，度小满将继续加大技术研发力度，探索多模态在金融领域应用的可行性路径，持续研发推出新技术、新成果，为助推多模态与金融行业整合发展注入新鲜血液。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

华为Mate70系列现身官网共8种配色最高可选16GB+1TB内存

三季度全球TWS出货量排名公布：小米和华为进前五

期待！2024年世界互联网大会乌镇峰会互联网公益慈善论坛即将启动

Canalys：全球个人智能音频设备 Q3 出货量激增 15%

OPPO Reno13 系列手机四款配色公布，全系金属中框

闪耀操作系统大会，润和软件首个基于openEuler的AI原生操作系统重磅发布

北电数智：以“星火”点亮数字化中国的前进之路

南凌科技荣获“标杆引领·品牌先锋奖”，再度彰显行业领先地位

造物数科受邀参加第三届数据治理年会入选数据管理优秀案例

打破轻薄、续航、性能“三角悖论”，ThinkPad X1 Carbon Aura AI开启预约

ROG DAY 2024战车巡游，燃动江城

vivo S20系列即将发布配置提前流出最高6500mAh电池

华为Mate70今日12:08开启预定，26日的发布会真的太炸了！！！

“中国女装第一股”退市！

努比亚 Z70 Ultra 手机更多参数曝光：后置 50Mp 35mm 大底主摄、可变光圈

华为Mate 70正式开订！电商平台页面已上线

余承东微博小尾巴露馅！华为Mate70将有Pro+版本

努比亚Z70 Ultra强悍守护：将全系支持IP68、IP69防尘防水

海外直播平台 Twitch 因数据泄露事故在土耳其被罚 200 万里拉

TrendForce：预计 2025 年 DRAM 价格将下跌

IPO堰塞湖下的并购盛宴：参与方“心怀算计”，有“馅饼”更有“陷阱”｜焦点

剧透比亚迪《工程师之魂》，王传福的命运三重奏

小米手机下次相机版本更新增加水印颜色选项，老机型也会版本迭代

消息称抖音正推进“V”项目，包括直播游戏互动、AI 分身功能等

轻薄手机用上潜望！曝vivo S20系列首次搭载潜望长焦镜头

苹果打算明年带来AirTag 2，或与M4 MacBook Air一起发布

曝合创汽车解散上海分公司员工：拖欠被裁员工赔偿金

全站最新

广州车展热闹之下的中国车市

华为Mate70系列现身官网共8种配色最高可选16GB+1TB内存

三季度全球TWS出货量排名公布：小米和华为进前五

期待！2024年世界互联网大会乌镇峰会互联网公益慈善论坛即将启动

Canalys：全球个人智能音频设备 Q3 出货量激增 15%

OPPO Reno13 系列手机四款配色公布，全系金属中框

闪耀操作系统大会，润和软件首个基于openEuler的AI原生操作系统重磅发布

北电数智：以“星火”点亮数字化中国的前进之路

热门推荐

华为Mate70系列现身官网共8种配色最高可选16GB+1TB内存

三季度全球TWS出货量排名公布：小米和华为进前五

期待！2024年世界互联网大会乌镇峰会互联网公益慈善论坛即将启动

Canalys：全球个人智能音频设备 Q3 出货量激增 15%

OPPO Reno13 系列手机四款配色公布，全系金属中框

闪耀操作系统大会，润和软件首个基于openEuler的AI原生操作系统重磅发布

北电数智：以“星火”点亮数字化中国的前进之路

南凌科技荣获“标杆引领·品牌先锋奖”，再度彰显行业领先地位

造物数科受邀参加第三届数据治理年会入选数据管理优秀案例

打破轻薄、续航、性能“三角悖论”，ThinkPad X1 Carbon Aura AI开启预约

ROG DAY 2024战车巡游，燃动江城

vivo S20系列即将发布配置提前流出最高6500mAh电池

华为Mate70今日12:08开启预定，26日的发布会真的太炸了！！！

“中国女装第一股”退市！

努比亚 Z70 Ultra 手机更多参数曝光：后置 50Mp 35mm 大底主摄、可变光圈