阶跃星辰最新开源视频模型Step-Video-T2V效果(受访者提供)
DeepSeek引发的开源大模型热潮依然在继续,今天一天共有超过五款 AI 模型对外公布开源消息。
钛媒体AGI获悉,2月18日上午,“大模型六小虎”之一通用人工智能公司的阶跃星辰,与吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。
其中,全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V 将进行开源,参数量达到300亿,可直接生成204帧、540P分辨率的高质量视频。
阶跃星辰第二款开源模型,是行业内首款产品级开源语音交互大模型阶跃Step-Audio,高达1300亿参数规模,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话、高质量音色复刻并进行角色扮演,满足影视娱乐、社交、游戏等行业场景下应用需求。
在主流公开测试集中,阶跃Step-Audio模型性能表现突出。此外,阶跃星辰还自建并开源了多维度评估体系 Stepeval-Audio-360 基准测试。
阶跃星辰第三款开源模型,是发布并开源了针对文生视频质量评测的新基准数据集 Step-Video-T2V-eval,包含128条源于真实用户的中文评测问题,旨在评估生成视频在运动、风景、动物、组合概念、超现实、人物、3D 动画、电影摄影等 11 个内容质量维度。评测结果显示,阶跃Step-Video-T2V 的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面优异。
目前,在跃问网页端和跃问 App 上都可以体验阶跃Step-Video-T2V 的视频生成能力。值得注意的是,早前阶跃星辰“跃问”产品正式接入DeepSeek模型,提供“深度思考”服务。
不止是阶跃星辰。2月18日上午,昆仑万维宣布,联合开源中国发布首个面向AI短剧创作的视频生成模型SkyReels-V1,以及中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。
其中,昆仑万维称,SkyReels-V1不仅支持文生视频、还能支持图生视频,是开源视频生成模型中参数最大的支持图生视频的模型,在同等分辨率下各项指标实现开源SOTA。
SkyReels-V1文生视频指标对比
算力层面,昆仑万维称,在自研推理优化框架“SkyReels-Infer”的加持下,V1大幅提升推理效率,实现544p分辨率,推理基于单台4090只需80s,还支持分布式多卡并行。在同等RTX4090资源情况下,SkyReels-Infer版本比腾讯混元HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s)。此外,采取新的技术可满足低显存用户级显卡运行需求,以及支持模型编译优化等,进一步优化延迟,而基于开源diffuser库,提升易用性。
昆仑万维表示,同时将SOTA级别的SkyReels-V1和SkyReels-A1进行开源,是AI短剧行业首例,也是昆仑万维SkyReels回馈行业迈出的一小步,更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。未来,短剧与游戏、虚拟现实等领域的跨界发展,将会加速产业融合,并且AI短剧也有希望从“技术实验”迈向“主流创作”,成为全球文化输出的新载体。
事实上,自1月中旬起,中国开源 AI 模型DeepSeek横空出世,震动了整个AI科技行业,其成本便宜,DeepSeek-V3仅用两个月就完成了训练,成本为560万美元,仅为OpenAI等公司所花费金额的一小部分。另一方面,DeepSeek是开源模式,迅速吸引了包括互联网科技公司及其他领域用户介入,尤其对于算力、AI人才都会有新的促进作用。
2月16日,IDC与浪潮信息联合发布的《中国人工智能计算力发展评估报告》显示,2024年,中国智能算力规模、市场规模分别同比增长74.1%、86.9%,预计2025年,中国智能算力规模较2024年将增长43%;中国人工智能算力市场规模将达到259亿美元,较2024年增长36.2%。
钛媒体AGI从企查查处获悉,截至目前,中国现存算力相关企业647家。近十年相关企业注册量呈整体增长态势,2024年,全年注册207家相关企业,同比增长52.21%,而2025年国内则已经注册15家 AI 算力相关企业。
从注册资本分布来看,超40%算力相关企业注册资本在千万元以上,从行业上看,超四成相关企业归属于科学研究和技术服务业。
人才层面,智联招聘发布的最新报告显示,从求职端看,计算机硬件、计算机软件行业第二周求职人数环比增速分别为49.9%、38.6%,位列行业前二,IT服务、通信/电信/网络设备行业求职也环比增长3成;从职业看,前端开发、软件研发、移动研发、测试工程师、人工智能工程师、通信及硬件研发等技术岗位求职环比增速均在3-5成;从招聘薪酬看,节后第二周,计算机软件、计算机硬件行业平均招聘月薪分别为11360元、10660元,较第一周分别上涨8.3%、5.9%。
报告指出,AI发展对整个信息技术产业提振效果显现,计算机硬件/软件人才供需、薪资待遇走高。
就在2月18日,OpenAI CEO奥尔特曼(Sam Altman)表示开源下一代模型,询问大家希望下一个开源项目是哪一种,是做一个“相当小但仍需要在GPU上运行的o3-mini级模型”,或者“能做的最好的手机大小的模型”。
这意味着,OpenAI 即将开源某个大模型,而这一举措,无疑是对当前AI开源趋势的积极响应。
就在奥特曼发文的同一天,也是马斯克宣布要发布“世界上最聪明的人工智能”的时间。马斯克旗下的人工智能初创公司xAI将发布最新版Grok 3聊天机器人,尽管比原计划推迟了数月,但仍引起外界高度关注。
(本文首发于钛媒体App,作者|林志佳)