当前位置：首页 » 资讯 » 新科技 » 正文

腾讯混元图生视频发布并开源，同时上线音频与动作驱动等能力

IP属地北京 编辑：朱天宇雷递 时间：2025-03-06 17:35:59

网乐天 3月6日
腾讯混元今日发布图生视频模型并对外开源，同时上线对口型与动作驱动等玩法，并支持生成背景音效及2K高质量视频。
基于图生视频的能力，用户只需上传一张图片，并简短描述希望画面如何运动、镜头如何调度等，混元即可按照用户要求让图片动起来，变成5秒的短视频，还能自动配上合适的背景音效。
此外，上传一张人物图片，并输入希望“对口型”的文字或音频，图片中的人物即可“说话”或“唱歌”；如果选择动作模版，还能一键生成同款跳舞视频。
此次开源的图生视频模型，是混元文生视频模型开源工作的延续，模型总参数量保持 130 亿，适用于多种类型的角色和场景，包括写实视频制作、动漫角色甚至CGI角色制作的生成。开源内容包含权重、推理代码和LoRA训练代码，支持开发者基于混元训练专属LoRA等衍生模型。
据混元开源技术报告披露，混元视频生成模型具备灵活的扩展性，图生视频和文生视频在相同的数据集上开展预训练工作。在保持超写实画质、流畅演绎大幅度动作、原生镜头切换等特性的基础上，让模型能够捕捉到丰富的视觉和语义信息，并结合图像、文本、音频和姿态等多种输入条件，实现对生成视频的多维度控制。
混元视频生成模型开源以来，一直保持较高的热度，目前Github平台上Star数超过8.9K。多位开发者自发制作基于社区Hunyuanvideo的插件与衍生模型，积累超过 900 个衍生版本。更早开源的混元DiT文生图模型，在国内外衍生模型数量多达1600多个。
目前，混元开源系列模型已经完整覆盖文本、图像、视频和3D生成等多个模态，在Github累计获得超 2.3 万开发者关注和star。
———————————————
由媒体人雷建平创办，若转载请写明来源。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

EA游戏《双影奇境》今晚发售：Steam 国区198元，港区定价399港币

苹果最贵的iPhone ，折叠一下砍了Face ID

会“卖萌”的阿里大模型，能跟DeepSeek-R1扳手腕

华为重启Linux，鸿蒙PC在路上

竞逐千亿元蓝海市场！首航新能全球化布局走在行业前列，光储双轮驱动助腾飞

仅仅2小时：摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

我国自主研发CR450动车组下线试验时速达450公里

PyTorch助力，英特尔锐炫显卡赋能生成式AI

iPhone 16e拆解外媒称自研基带是亮点

华为进军脑机接口？相关专利已公布

Mac系列新品京东首发国家补贴叠加教育优惠至高可省3500元

阿里云亮相2025巴展加速开拓全球市场

ETF今日收评丨恒生互联网ETF涨近8%，云计算、信创、软件等ETF涨逾6%

腾讯混元图生视频发布并开源，同时上线音频与动作驱动等能力

DeepSeek的胡编乱造正淹没互联网

腾讯混元视频生成再升级，能让图片变5秒短视频

国内首个！中国电信助力“雄小农”打造DeepSeek农业行业大模型

腾讯混元视频生成再升级，发布图生视频、音频与动作驱动等能力

华为云广东DeepSeek思享会在穗举办

MWC 2025巴塞罗那：骁龙8至尊版荣获GTI移动技术创新突破奖和GLOMO最佳AI创新奖

Manus一夜爆火！A股相关概念股已涨疯，汉得信息、蓝色光标等“20cm”涨停

铭凡推出AI X1 Pro迷你机：搭载锐龙AI 9 HX 370、配指纹识别

姚明 2025 两会建议：动员未成年人开展息屏 24 小时行动

ASML否认在北京新建维修中心：仅在原有基础上升级和扩建

盒马踩刹车，不再摸着山姆过河，但也不会被阿里卖掉

股权投资迎新政利好，加强科技型中小企业支持

“英伟达小弟”上市风波不断：创始人巨额套现遭质疑大客户被传撤单

全站最新

EA游戏《双影奇境》今晚发售：Steam 国区198元，港区定价399港币

苹果最贵的iPhone ，折叠一下砍了Face ID

会“卖萌”的阿里大模型，能跟DeepSeek-R1扳手腕

华为重启Linux，鸿蒙PC在路上

竞逐千亿元蓝海市场！首航新能全球化布局走在行业前列，光储双轮驱动助腾飞

仅仅2小时：摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

我国自主研发CR450动车组下线试验时速达450公里

PyTorch助力，英特尔锐炫显卡赋能生成式AI

热门推荐

EA游戏《双影奇境》今晚发售：Steam 国区198元，港区定价399港币

苹果最贵的iPhone ，折叠一下砍了Face ID

会“卖萌”的阿里大模型，能跟DeepSeek-R1扳手腕

华为重启Linux，鸿蒙PC在路上

竞逐千亿元蓝海市场！首航新能全球化布局走在行业前列，光储双轮驱动助腾飞

仅仅2小时：摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

我国自主研发CR450动车组下线试验时速达450公里

PyTorch助力，英特尔锐炫显卡赋能生成式AI

iPhone 16e拆解外媒称自研基带是亮点

华为进军脑机接口？相关专利已公布

Mac系列新品京东首发国家补贴叠加教育优惠至高可省3500元

阿里云亮相2025巴展加速开拓全球市场

ETF今日收评丨恒生互联网ETF涨近8%，云计算、信创、软件等ETF涨逾6%

腾讯混元图生视频发布并开源，同时上线音频与动作驱动等能力

DeepSeek的胡编乱造正淹没互联网