当前位置: 首页 » 资讯 » 新科技 » 正文

首次实现中文文字生成,消息称阿里通义万相2.1视频模型今晚开源

IP属地 北京 编辑:陆辰风 IT之家 时间:2025-02-26 02:30:21

2 月 25 日消息,据新浪科技援引知情人士消息称,阿里巴巴将于今晚全面开源旗下视频生成模型万相 2.1 模型。

今年 1 月,阿里通义万相推出了 2.1 版本模型升级,其在视频生成、图像生成两大能力均有显著提升。

在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。

据介绍,通义万相 2.1 支持中英文视频,都可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等等。其还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。

官方曾表示,通义万相 2.1 支持中英文一键生成艺术字,还提供了多种视频特效选项,如过渡、粒子效果、模拟等等。

据此前报道,通义万相去年 9 月宣布支持文生视频、图生视频等,还有插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新