当前位置: 首页 » 资讯 » 新科技 » 正文

摩尔线程开源 vLLM-MUSA,通过 MUSA 软件栈对 CUDA 接口兼容

IP属地 北京 编辑:赵静 IT之家 时间:2024-11-05 19:25:58

11 月 5 日消息,摩尔线程官方今日发文,称已上线了大语言模型高速推理框架开源项目 vLLM 的 MUSA 移植版本,为开发者提供一个基于摩尔线程全功能 GPU 进行开源项目 MUSA 移植的范例。

vLLM 是一个高效且易用的大模型推理和服务框架,已在各种大语言模型中得到广泛应用,并成为业界常用的开源大模型推理框架。

摩尔线程团队基于 vLLM v0.4.2 版本进行了移植适配,为 vLLM 框架添加了摩尔线程 GPU 后端 Device 支持,并将移植适配后的 vLLM-MUSA 版本开源

开发者可以基于摩尔线程 GPU 及 vLLM-MUSA,进行二次开发、升级 vLLM 到社区更新版本等。

摩尔线程称通过 MUSA 软件栈对 CUDA 软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期。并提供 MUSIFY 自动代码移植工具等一系列工具和脚本,降低开发者在 MUSA 平台进行大语言模型训练和推理应用适配的难度。

附 vLLM-MUSA 开源地址:https://github.com/MooreThreads/vLLM_musa

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新