3 月 10 日消息,从东南大学官方微信公众号获悉,近日东南大学基于昇腾国产算力平台正式接入阿里最新开源模型 QwQ-32B,成为全国首个上线 QwQ-32B 服务的高校。
东南大学称,QwQ-32B 虽仅有 32B 参数,但通过大规模强化学习训练,在数学推理(AIME24 评测)、代码生成(LiveCodeBench)、工具调用(BFCL 测试)等任务中表现媲美 671B 参数的 DeepSeek-R1,甚至部分指标实现超越。
上图展示了 QwQ-32B 与其他领先模型在数学推理(AIME24 评测)、代码生成(LiveCodeBench)、工具调用(BFCL 测试)中的性能对比,QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。
东南大学表示,模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,助力师生在科研中快速实现 AI 推理需求。
集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。