11月8日,智谱技术团队宣布推出并开放源代码给最新升级的视频模型——CogVideoX v1.5。这一新版模型提升了视频生成的性能,能够产出5或10秒长、768P分辨率、每秒16帧的视频。此外,I2V模型现在支持多种尺寸比例,显著提高了图像转视频的质量和对复杂语义的理解能力。据官方消息,CogVideoX v1.5将登陆“清影”平台,并与新发布的CogSound音效模型联合使用。
升级后的新清影将拥有以下特性:
质量提升:在图像转视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面,能力得到了显著增强。
超高清分辨率:支持生成10秒、4K分辨率、60帧的超高清视频,为用户带来更优质的视觉体验。
可变比例:支持任意比例的视频生成,满足不同播放场景的需求。
多通道输出:同一指令或图片可一次性生成4个视频,提高创作效率。
带声效的AI视频:新清影能够生成与画面匹配的音效,让视频更加生动。