3月9日消息,国家超算互联网平台近日上线阿里巴巴开源推理模型QwQ-32B API接口服务,现在用户可获得免费的100万Tokens。
据悉,基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开源大模型的接口服务。
同时,依托超算互联网平台的超智融合算力、安全可信的环境,以及国产深算智能加速卡的良好生态,平台已同步上线QwQ-32B模型镜像、模型文件,用户无需下载本地,只需一键启动Notebook功能,即可在平台快速开发QwQ-32B模型,或引入专有数据进一步私有化部署。
QwQ-32B是阿里Qwen团队最新发布的推理模型,基于Qwen2.5-32B+强化学习构建。据官方公示的基准评测结果,在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,QwQ-32B 表现与DeepSeek-R1相当,远胜于 o1-mini 及相同尺寸的R1 蒸馏模型。
目前,超算互联网除提供QwQ-32B模型API接口服务外,近期还上线有DeepSeek-R1全家桶、最高671B满血版的API部署与AI Web应用服务。