当前位置：首页 » 资讯 » 新科技 » 正文

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

IP属地北京 编辑：赵磊云间有月 时间：2024-07-18 08:03:33

?Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏
快科技6月7日消息，Intel官方宣布，旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2（Qwen2）的全球发布提供支持，已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。
为了最大限度地提升诸通义千问2等大模型的效率，Intel进行了全面的软件优化，包括高性能融合算子、平衡精度和速度的先进量化技术等。
Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。
Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库、vLLM。
首先看Intel Gaudi AI加速器，专为生成式AI、大模型的高性能加速而设计，最新版的Gaudi Optimum可以轻松部署新号的大模型。
Intel使用Gaudi 2，对70亿参数、720亿参数的通义千问2模型的推理和微调吞吐量进行了基准测试，以下为详细性能指标和测试结果：
70亿参数通义千问2在单颗Gaudi 2加速器上的推理
720亿参数通义千问2在八颗Gaudi 2加速器上的推理
通义千问2 FP8在Gaudi 2加速器上的推理
通义千问2在Gaudi 2加速器上的微调
再看Intel至强处理器，作为通用平台具有广泛的可用性，适用于各个规模的数据中心，对于希望快速部署AI解决方案、没有专项基础设施企业非常理想。
至强处理器的每个核心都内置了Intel AMX高级矩阵扩展，可以处理多样化的AI工作负载，并加速AI推理。
以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例，通义千问2的下一个推理token延迟情况。
最后是消费级的AI PC，可以在本地部署大模型，既然可以使用处理器内置GPU核显、NPU AI引擎，也可以搭配独立的锐炫显卡。
以下展示了AI PC运行15亿参数的通义千问2：
酷睿Ultra 7 165H上的通义千问2推理
酷睿 Ultra 7 165H上的通义千问2下一个token延迟
锐炫A770 16GB显卡上的通义千问2下一个token延迟

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

realme 真我 V60 Pro 手机现身电信产品库，售价 1599 元起

系统集成商开启RTX 5090显卡AI工作站预订，8卡配置定价5万欧元

华为与大连化学物理研究所签约合作，共建智能化工大模型

Redmi K80 Pro性能拉满！王腾直呼“狂暴辣完爆13香”

REDMI K80 Pro升级全焦段旗舰三摄：小米15同款浮动长焦

REDMI推出后悔宝：友商骁龙8至尊版机型最高加1000回收

王腾：REDMI K80 Pro香爆了大哥小米15卖得挺贵的

实测华为Mate 70 Pro+，网速竟比Mate 60 Pro快一倍

银嘉金服旗下支付平台付临门及实控人被再次限消，涉案被执行金额超9千万

REDMI K80 Pro：骁龙8至尊版加持大满贯级性能表现

赵明曝光荣耀Magic 7 RSR保时捷版：带来全新大王算法

中国电信沙特公司在利雅得正式成立

微软申请分布式 VR 专利：用户可独立探索他人共享的虚拟世界

星之卡比初代容量只有64KB？游戏容量与内容质量哪个更重要

《英雄联盟：双城之战》剧集遭删减被删内容引发猜测

《银河战士 Prime 2：复刻版》将于2025年发售！高清画面实锤！

TGA 2024重磅升级！全新“玩家之声”奖项即将开启

这款游戏火了！游戏中切尔诺贝利禁区有人非法入内

动画太长？《双城之战》第二季内容被删减

全站最新

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

热门推荐

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

realme 真我 V60 Pro 手机现身电信产品库，售价 1599 元起

系统集成商开启RTX 5090显卡AI工作站预订，8卡配置定价5万欧元

华为与大连化学物理研究所签约合作，共建智能化工大模型

Redmi K80 Pro性能拉满！王腾直呼“狂暴辣完爆13香”

REDMI K80 Pro升级全焦段旗舰三摄：小米15同款浮动长焦

REDMI推出后悔宝：友商骁龙8至尊版机型最高加1000回收

王腾：REDMI K80 Pro香爆了大哥小米15卖得挺贵的