当前位置: 首页 » 资讯 » 新科技 » 正文

仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

IP属地 北京 编辑:陆辰风 驱动之家 时间:2025-03-06 20:33:06

快科技3月6日消息,3月6日一早,阿里云正式发布并开源全新推理模型“通义千问QwQ-32B”,而在仅仅2个小时后,摩尔线程就迅速、高效地完成了适配,实现了Day0级支持!

基于大语言模型高速推理框架vLLM、MT Transformer推理引擎部署的QwQ-32B,在摩尔线程GPU上的实际运行中,展现出了卓越的推理性能与稳定性,再次印证了摩尔线程MUSA架构的强大生态兼容性。

值得一提的是,在此之前,摩尔线程仅用一周时间,就火速支持了DeepSeek开源周“全家桶”。

目前,摩尔线程已将这一成果开放上线至模型广场“夸娥工场”。

夸娥工场是摩尔线程倾力打造的模型展示中心,可为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。

夸娥工场体验地址:

https://playground.mthreads.com

QwQ-32B体验地址:

https://playground.mthreads.com:12019

摩尔线程模型广场“夸娥工场”体验界面

在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1。

尽管它只有32B参数,但通过大规模强化学习训练,其在数学、编程、通用能力等领域实现了显著突破,展现了卓越的智能化水平。

从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本,在LiveBench、BFCL测试中甚至击败了满血版的Deepseek-R1-671B。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新