当前位置：首页 » 资讯 » 新科技 » 正文

金山云完成阶跃星辰最新两款开源多模态大模型适配

IP属地北京 编辑：冯璃月砍柴网 时间：2025-02-25 14:33:30

金山云已完成对阶跃星辰最新开源的两款多模态大模型的适配，包括全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。目前，用户可登陆金山云官方网站进行体验。
*登陆金山云账号控制台选择裸金属服务器-新建实例
Step-Video-T2V模型
金山云针对Step-Video-T2V模型，为用户提供强大的算力支持和稳定的运行环境让模型性能得以充分释放，带来流畅的视频生成体验。
据悉，Step-Video-T2V模型的参数达300亿，可直接生成204帧、540P分辨率的高质量视频。评测结果显示，该模型在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频生成模型。
*图为Step-Video-T2V-eval评测结果
阶跃星辰官方提供了多卡并行部署的支持，其中文本编码器和VAE部分由独立的进程维护，DiT部分可以选择4卡并行或8卡并行，每张卡需要至少80G显存。如果要在单台机器上运行，推荐使用5个80G显存的GPU。
在部署方面，金山云已预装好ubuntu22.04-Step-Video-T2V模型和依赖环境的镜像。在多卡并行部署时，金山云的云计算环境可精准协调各卡资源，保障文本编码器、VAE和DiT等部分协同工作，大幅提升视频生成效率。
*金山云裸金属服务器控制台创建流程，选择内置Step-Video-T2V的自定义镜像创建,创建完成即可启动模型并使用
运行测试
登录服务器进入Step-Video-T2V-main目录启动服务
cd Step-Video-T2V-main
python3 api/call_remote_server.py --model_dir /models/stepvideo-t2v
出现如下提示后服务启动成功
* Running on all addresses (0.0.0.0)
Step-Audio模型
金山云同时完成了实时语音对话系统Step-Audio模型的适配工作。金山云将借助先进的云计算技术，降低模型响应延迟，让用户与模型的对话更加自然流畅。在实际应用中，无论是实时语音聊天，还是语音指令控制，金山云都能确保 Step-Audio模型快速准确地响应，为用户提供优质的语音交互服务。
Step-Audio作为业内创新性的开源语音模型，能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达，并且能和用户自然地进行高质量对话。根据 LlaMA Question等五大主流公开测试，Step-Audio模型性能均位列第一，并在HSK-6(汉语水平考试六级)评测中表现突出，是最懂中国话的开源语音交互大模型。
*图为5大主流公开评测结果
在部署方面，金山云已预装好ubuntu22.04-Step-Audio模型和依赖环境的镜像。
*金山云裸金属服务器控制台创建流程，选择内置Step-Audio的自定义镜像创建，创建完成即可启动模型并使用
运行测试
登录服务器进入Step-Audio-main目录启动服务
cd Step-Audio-main
python3 tts_inference.py --model-path /models/Step-Audio/model --output-path /root/Step-Audio-output --synthesis-type tts
在人工智能高速发展的当下，秉承技术立业的金山云将始终与前沿技术同频，继续携手生态合作伙伴为前沿技术的落地转化提供助力。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

微软CEO对AI持续炒作感到厌倦称很多是无意义的基准测试

传音控股2024年营收687亿：扣非后净利46亿同比降10%

林里柠檬茶服务态度差遭差评后堵门、找家长消费者报警

佳禾食品拟募资7.25亿元加码咖啡核心业务粉末油脂形势严峻

A股突发！翻倍牛股，尾盘跳水跌停

告别鬼影、眩光！小米15 Ultra首发徕卡超低反射镜头玻璃

代号“夜神” 冠绝历代！小米15 Ultra搭载徕卡超纯光学系统

“雪王”或成现象级IPO！蜜雪冰城融资认购金额已超万亿港元，富途证券认购最多

能拖还能抓石头G30 Space探索版评测：重新定义下一代家用清洁机器人

小猴云印重磅升级，9.9元顺丰包邮，引领线上打印新变革

拯救苹果的经典之作！iMac设计仅用了三周时间

史上第一打造的史上最强有多强东芝X20热泵洗烘一体机重磅上市

佳能可换镜相机连续22年全球第一稳压尼康和索尼

重启“S”型号！小米15S Pro通过工信部认证或4月发布

真我Neo7 SE评测：能打耐造 1500元档的全能游戏神机

传音控股 2024 年净利润 55.9 亿元，同比增长 0.96%

realme 真我 Neo7 SE 手机发布

腾讯字节，做AI to C的两个“极端”在顶峰相遇

消息称意法半导体 CEO 将被免职，意大利政府不满其业绩

555亿零食巨头，盯上9.9元白酒生意

阿里为AI投资再添一把火！铜缆高速连接迎新机遇？

1799 元起，realme 真我 Neo7 SE 手机价格公布

realme 真我 Buds Air7 耳机发布：52dB 降噪，售价 299 元

DeepSeek API开放平台恢复充值服务并调整价格

坐在家里赚美金，又一万亿新商机崛起

微软测试免费版Office：基础功能受限且含广告

两个月获利或超20亿，美团在这个赛道赚翻了

全站最新

微软CEO对AI持续炒作感到厌倦称很多是无意义的基准测试

传音控股2024年营收687亿：扣非后净利46亿同比降10%

林里柠檬茶服务态度差遭差评后堵门、找家长消费者报警

佳禾食品拟募资7.25亿元加码咖啡核心业务粉末油脂形势严峻

工信部392批新车拾遗：新问界M9智驾升级，新博越L改了前脸

换车有福利！河北省2025年汽车置换更新补贴服务平台上线

启辰V-Online DD-i混动版焕新上市，新风格能否引领潮流？

华为智驾加持，燃油车智能时代真被一汽奥迪A5L开启了？

热门推荐

微软CEO对AI持续炒作感到厌倦称很多是无意义的基准测试

传音控股2024年营收687亿：扣非后净利46亿同比降10%

林里柠檬茶服务态度差遭差评后堵门、找家长消费者报警

佳禾食品拟募资7.25亿元加码咖啡核心业务粉末油脂形势严峻

A股突发！翻倍牛股，尾盘跳水跌停

告别鬼影、眩光！小米15 Ultra首发徕卡超低反射镜头玻璃

代号“夜神” 冠绝历代！小米15 Ultra搭载徕卡超纯光学系统

“雪王”或成现象级IPO！蜜雪冰城融资认购金额已超万亿港元，富途证券认购最多

能拖还能抓石头G30 Space探索版评测：重新定义下一代家用清洁机器人

小猴云印重磅升级，9.9元顺丰包邮，引领线上打印新变革

拯救苹果的经典之作！iMac设计仅用了三周时间

史上第一打造的史上最强有多强东芝X20热泵洗烘一体机重磅上市

佳能可换镜相机连续22年全球第一稳压尼康和索尼

重启“S”型号！小米15S Pro通过工信部认证或4月发布

真我Neo7 SE评测：能打耐造 1500元档的全能游戏神机