当前位置: 首页 » 资讯 » 新科技 » 正文

元象发布中国最大 MoE 开源大模型 XVERSE-MoE-A36B

IP属地 北京 编辑:陈丽 IT之家 时间:2024-09-13 21:15:58

9 月 13 日消息,元象 XVERSE 发布中国最大 MoE 开源模型XVERSE-MoE-A36B

该模型总参数 255B,激活参数 36B,官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升,同时训练时间减少 30%,推理性能提升 100%,使每 token 成本大幅下降。

MoE(Mixture of Experts)混合专家模型架构,将多个细分领域的专家模型组合成一个超级模型,在扩大模型规模的同时,保持模型性能最大化,甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、马斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。

在多个评测中,元象 MoE 超过多个同类模型,包括国内千亿 MoE 模型 Skywork-MoE、传统 MoE 霸主 Mixtral-8x22B 以及 3140 亿参数的 MoE 开源模型 Grok-1-A86B 等。

附相关链接:

Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36B 魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36B Github:https://github.com/xverse-ai/XVERSE-MoE-A36B

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新