当前位置：首页 » 资讯 » 新科技 » 正文

摩尔线程支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

IP属地北京 编辑：任飞扬 IT之家 时间：2025-02-28 00:01:47

2 月 27 日消息，在 DeepSeek 开源周第四日，摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe，并发布相关开源代码仓库：MT-DeepEP 和 MT-DualPipe。
据介绍，DeepEP是一个用于 MoE（混合专家）模型训练和推理的开源 EP（expert parallelism，专家并行）通信库，主要适用于大模型训练，特别是需要 EP 的集群训练。它通过优化通信信道的使用率，提升了训练效率。摩尔线程基于 MUSA Compute Capability 3.1 全功能 GPU 适配了 DeepEP，并支持以下特性：

高效优化的 All-to-All 通信，支持 dispatch & combine

支持 MTlink + GPU（MUSA Compute Capability 3.1）节点内通信

训练及推理预填充阶段的高吞吐量计算核心

推理解码阶段的低延迟计算核心

原生支持 FP8 数据分发

灵活控制 GPU 资源，实现计算与通信的高效重叠
DualPipe是 DeepSeek-V3 提出的双向流水线并行算法，通过前向计算与后向计算阶段的计算与通信完全重叠，减少了“流水线气泡”（设备空闲等待）。摩尔线程依托深度学习框架 Torch-MUSA（已开源）和 MUSA 软件栈全方位的兼容性，实现了对 DualPipe 这一算法的支持。
目前，MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架和 MT-TransformerEngine 框架（即将开源），实现 DeepSeek V3 训练流程完整复现。此外，MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离，进一步降低气泡占比，优化通信效率。同时，MT-DualPipe 与 MT-TranformerEngine 和 MT-DeepEP 的结合，可利用 MT-DeepEP 和异步通信引擎实现更高效的通信掩盖，降低对计算资源损耗。
附 Torch-MUSA 开源地址如下：

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

EMQ 如何用DeepSeek大模型重构可观测性数据分析？

从36亿到21亿！四年拉扯终收购YY，百度得到了什么？

我国研发世界首款光子时钟芯片：轻松超过100GHz！

DeepSeek吃光了云端的闲置算力 AI大模型重构云计算产业价值链

中交集团召开“蓝翼”大模型发布会暨“AI+”专项行动推进会

亨通光电：能源转型先锋，全球互联网建设中的中国力量

6499元！小米15 Ultra死磕影像旗舰，手机高端化的关键一役？

冲击超高端！小米15 Ultra正式发布：6499元起不涨价

米家首款中央空调Pro发布：最贵仅27999元！不到大金一半价格

雷军：太佩服保时捷了有实力还有格局

999元小米15 Ultra专业影像套装发布：2000mAh电池可反充手机

小米SU7 Ultra正式发布，售价52.99万元

机械师曙光18 Pro 开放预约：酷睿 Ultra 9 275HX + RTX 5090

Epic 喜加一：《Mages of Mystralia》游戏免费领取

同尺寸续航最强的苹果手机！iPhone 16e电池容量公布：3961mAh

【雄安之声】雄安新区发布国内首个DeepSeek农业行业大模型

诚至金开丨DeepSeek-R1大模型助力政务服务提质增效

四川3家银行部署DeepSeek等大模型应用，多元化应用场景将迎新技术狂欢？

较年前涨价10万！H20已成“大厂最爱” 英伟达是DeepSeek火爆最大赢家？

突发！金价大跳水！

3月6日退市！这家上市25年A股公司，曾连续5年财务造假

小米手机「焕新极简相机」5 月中旬起陆续推送

胡润打假“雷军当中国首富”：可能前三名

摩尔线程支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

京东云发布言犀智能体平台、云海AI存储等八大智算产品

小米SU7 Ultra发布：最高时速359km/h，52.99万元起

硬装开始，雷军进场！小米今晚发布的这些家电太可怕了

全站最新

EMQ 如何用DeepSeek大模型重构可观测性数据分析？

新能源汽车年检有新规，3月起施行！必检项目有→

烟酒店自救新招：聚焦精酿啤酒，实现流量利润双赢

戴德梁行：购房门槛降低刺激需求，一线城市以价换量趋势明显

从36亿到21亿！四年拉扯终收购YY，百度得到了什么？

我国研发世界首款光子时钟芯片：轻松超过100GHz！

小米发布新车，处处可见常州智造！

江苏苏州服装织唛商标销售如何讲好企业故事

热门推荐

EMQ 如何用DeepSeek大模型重构可观测性数据分析？

从36亿到21亿！四年拉扯终收购YY，百度得到了什么？

我国研发世界首款光子时钟芯片：轻松超过100GHz！

DeepSeek吃光了云端的闲置算力 AI大模型重构云计算产业价值链

中交集团召开“蓝翼”大模型发布会暨“AI+”专项行动推进会

亨通光电：能源转型先锋，全球互联网建设中的中国力量

6499元！小米15 Ultra死磕影像旗舰，手机高端化的关键一役？

冲击超高端！小米15 Ultra正式发布：6499元起不涨价

米家首款中央空调Pro发布：最贵仅27999元！不到大金一半价格

雷军：太佩服保时捷了有实力还有格局

999元小米15 Ultra专业影像套装发布：2000mAh电池可反充手机

小米SU7 Ultra正式发布，售价52.99万元

机械师曙光18 Pro 开放预约：酷睿 Ultra 9 275HX + RTX 5090

Epic 喜加一：《Mages of Mystralia》游戏免费领取

同尺寸续航最强的苹果手机！iPhone 16e电池容量公布：3961mAh