当前位置：首页 » 资讯 » 新科技 » 正文

Meta推出Apollo开源模型，让AI“看懂”视频

IP属地北京 编辑：江紫萱砍柴网 时间：2024-12-19 10:14:05

12 月 18 日消息，meta 携手斯坦福大学，推出全新 AI 模型系列 Apollo，显著提升机器对视频的理解能力。
尽管人工智能在处理图像和文本方面取得了巨大进步，但让机器真正理解视频仍然是一个重大挑战。
视频包含复杂的动态信息，人工智能更难处理这些信息，不仅需要更多的计算能力，而且如何设计最佳 AI 视频解读系统，也存在诸多困难。
在视频处理方面，研究人员发现，保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件，一个处理单独的视频帧，而另一个跟踪对象和场景如何随时间变化。
此外，在处理后的视频片段之间添加时间戳，有助于模型理解视觉信息与文本描述之间的关系，保持时间感知。
在模型训练方面，团队研究表明训练方法比模型大小更重要。Apollo 模型采用分阶段训练，按顺序激活模型的不同部分，比一次性训练所有部分效果更好。
此外 meta 公司还不断优化数据组合，发现 10~14% 的文本数据，其余部分略微偏向视频内容，可以更好地平衡语言理解和视频处理能力。
Apollo 模型在不同规模上均表现出色，较小的 Apollo-3B 超越了 Qwen2-VL 等同等规模的模型，而 Apollo-7B 超过更大参数的同类模型，meta 已开源 Apollo 的代码和模型权重，并在 Hugging Face 平台提供公开演示。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

微软 Windows 11悄悄上线新功能：系统自带广告！

Steam年度统计报告出炉：玩家平均会玩四款游戏

2024年最差游戏榜单出炉：乌托邦之城榜首！

《仙剑奇侠传四》重制版高清截图曝光史诗级剧情等你来解锁

《黑神话：悟空》表情包上线冯骥“菜就多练”表情引发众人模仿

是的《巫师4》将以希里为女主角这个决定很对

中国太平换帅：总经理尹兆君升任董事长，王思东到龄退休

力争2027年量产2nm！日本接收首台EUV光刻机：重71吨、四阶段安装

消息称OpenAI拟斥巨资“赎身”，摆脱非营利组织控制

谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的Gemini回复

图森未来宣布更名CreateAI：从自动驾驶跨入AI赛道，打造《金庸群侠传》《三体》IP内容

百度员工：极越ASD和地图导航由百度兜底，不会停止服务

HAMR 17年研发终落地！希捷发布最大32TB硬盘可惜是SMR

未成年人成博主流量密码抖音：严打虚假“网红儿童”人设

雷军：从程序员到科技巨头，小米方法论背后的商业智慧

消息称 OpenAI 拟斥巨资“赎身”，摆脱非营利组织控制

两次出圈！易烊千玺音乐会和微电影热度满满，这个品牌始终在身后

玩家别更新！微软Win11 24H2新Bug确认：或致游戏崩溃

年度口碑佳作！易烊千玺主演九号公司微电影《记忆奇旅》再获殊荣

曝新款小米平板可能采用刘海屏设计配14英寸OLED屏

消息称大众汽车与工会仍在就工厂关闭和减薪问题进行谈判

人工耳蜗国采首轮报价结果出炉，美笛乐、领先仿生、力声特拟中选

蚂蚁集团：目前没有上市计划更不存在所谓的“借壳上市”

量子科技最新3大突破！低位超级黑马，外资抢筹8亿，比肩谷歌！

数字鸿沟、科技伦理问题待解，互联网行业如何践行AI向善？

蚂蚁集团：目前没有上市计划更不存在所谓“借壳上市”

A股亮点！两大板块，逆势爆发！

全站最新

微软 Windows 11悄悄上线新功能：系统自带广告！

Steam年度统计报告出炉：玩家平均会玩四款游戏

2024年最差游戏榜单出炉：乌托邦之城榜首！

《仙剑奇侠传四》重制版高清截图曝光史诗级剧情等你来解锁

《黑神话：悟空》表情包上线冯骥“菜就多练”表情引发众人模仿

是的《巫师4》将以希里为女主角这个决定很对

中国太平换帅：总经理尹兆君升任董事长，王思东到龄退休

力争2027年量产2nm！日本接收首台EUV光刻机：重71吨、四阶段安装

热门推荐

微软 Windows 11悄悄上线新功能：系统自带广告！

Steam年度统计报告出炉：玩家平均会玩四款游戏

2024年最差游戏榜单出炉：乌托邦之城榜首！

《仙剑奇侠传四》重制版高清截图曝光史诗级剧情等你来解锁

《黑神话：悟空》表情包上线冯骥“菜就多练”表情引发众人模仿

是的《巫师4》将以希里为女主角这个决定很对

中国太平换帅：总经理尹兆君升任董事长，王思东到龄退休

力争2027年量产2nm！日本接收首台EUV光刻机：重71吨、四阶段安装

消息称OpenAI拟斥巨资“赎身”，摆脱非营利组织控制

谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的Gemini回复

图森未来宣布更名CreateAI：从自动驾驶跨入AI赛道，打造《金庸群侠传》《三体》IP内容

百度员工：极越ASD和地图导航由百度兜底，不会停止服务

HAMR 17年研发终落地！希捷发布最大32TB硬盘可惜是SMR

未成年人成博主流量密码抖音：严打虚假“网红儿童”人设

雷军：从程序员到科技巨头，小米方法论背后的商业智慧