当前位置：首页 » 资讯 » 新科技 » 正文

Meta推出Apollo开源多模态模型：让AI看懂长视频，还能回答问题

IP属地北京 编辑：沈如风十轮网 时间：2024-12-20 12:40:22

meta携手斯坦福大学，推出全新AI模型系列Apollo，显著提升机器对视频的理解能力。
尽管人工智能在处理图像和文本方面取得了巨大进步，但让机器真正理解视频仍然是一个重大挑战。因为视频包含复杂的动态资讯，人工智能更难处理这些资讯，不仅需要更多的计算能力，而且如何设计最佳AI视频解读系统，也存在诸多困难。
在视频处理方面，研究人员发现，保持每秒恒定的帧采样率能获得最佳结果。因此Apollo模型使用两个不同的组件，一个处理单独的视频帧，而另一个跟踪对象和场景如何随时间变化。目前最常可以处理一小时的长视频。
此外，在处理后的视频片段之间添加时间戳，有助于模型理解视觉资讯与文本描述之间的关系，保持时间感知。
在模型训练方面，团队研究表明训练方法比模型大小更重要。Apollo模型采用分阶段训练，按顺序启动模型的不同部分，比一次性训练所有部分效果更好。
此外meta公司还不断优化数据组合，发现10-14%的文本数据，其余部分略微偏向视频内容，可以更好地平衡语言理解和视频处理能力。
Apollo模型在不同规模上均表现出色，较小的Apollo-3B超越了Qwen2-VL等同等规模的模型，而Apollo-7B超过更大参数的同类模型，meta已开源Apollo的程序代码和模型权重，并在Hugging Face平台提供公开展示。
参考
meta's new Apollo models aim to crack the video understanding problem
meta AI Releases Apollo: A New Family of Video-LMMs Large Multimodal Models for Video Understanding
Apollo: An Exploration of Video Understanding in Large Multimodal Models

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

真我14 Pro＋全球首发温度感应变色技术珍珠白色后盖遇冷变蓝色

曝小米15 Ultra搭载2亿像素潜望长焦支持100倍AI融合变焦

苹果获MacBook Pro设计新专利探索可拆卸摄像头和屏幕

努比亚Focus2官图现身欧盟认证网站采用后置三摄像头设计

谷歌发布首个通用推理模型登顶Chatbot Arena LLM排行榜

韩国研究团队研发出新型无线充电系统实现三维空间任意位置充电

全球第一拍照手机！华为Pura 70 Ultra官方降价：7499元起

充电盒存在冒烟或烧毁风险，铁三角在国内召回无线耳机

华硕 ROG 新品曝光：覆盖 6 款RTX 50显卡型号，预计CES 2025亮相

广东低空经济发展调研报告重磅发布：规模超千亿居全国前列，广深珠三核联动

企业价值止步不前，盐津铺子输在了哪？

魏思琪谈小米SU7熔岩橙：绝对被低估的一款颜色晚上好看得要命

暴增100%？3K、乐牛加码布局！小游戏还有三大机会！

尊界法务开始上班了发现侵权网友已向公安举报处理

11个月，常青游戏赚了400亿！10款游戏进入十亿俱乐部，腾讯网易牢牢把持C位

摩尔线程发布图形显卡驱动 v280.90.1，修复《黑神话：悟空》闪退

英特尔确认酷睿 Ultra 200S 处理器五大表现问题，已有四项可解决

VR/MR市场激战，苹果Vision Pro拿下市占率第三！

恐怖游戏《寂静岭》新作开发中！ Bloober Team或将重制《寂静岭1/2》

《超级键盘侠》新版本来袭！快加入史诗级键盘大战

交银金租首架C919飞机交付南航：经营飞机超420架

贵上天！ RTX5090台式机价格曝光

疾速6000MT/s！雷克沙战神之翼ARES RGB DDR5超频内存图赏

智源最新评测结果发布：豆包大模型“主观评测”排名第一，多榜单位居国内第一

联想Yoga屏下摄像头笔记本照片首曝！正面视觉冲击力十足

俄罗斯将自研光刻机！宣称比ASML便宜

俯瞰华润系“医药帝国”

全站最新

真我14 Pro＋全球首发温度感应变色技术珍珠白色后盖遇冷变蓝色

曝小米15 Ultra搭载2亿像素潜望长焦支持100倍AI融合变焦

苹果获MacBook Pro设计新专利探索可拆卸摄像头和屏幕

努比亚Focus2官图现身欧盟认证网站采用后置三摄像头设计

谷歌发布首个通用推理模型登顶Chatbot Arena LLM排行榜

韩国研究团队研发出新型无线充电系统实现三维空间任意位置充电

全球第一拍照手机！华为Pura 70 Ultra官方降价：7499元起

充电盒存在冒烟或烧毁风险，铁三角在国内召回无线耳机

热门推荐

真我14 Pro＋全球首发温度感应变色技术珍珠白色后盖遇冷变蓝色

曝小米15 Ultra搭载2亿像素潜望长焦支持100倍AI融合变焦

苹果获MacBook Pro设计新专利探索可拆卸摄像头和屏幕

努比亚Focus2官图现身欧盟认证网站采用后置三摄像头设计

谷歌发布首个通用推理模型登顶Chatbot Arena LLM排行榜

韩国研究团队研发出新型无线充电系统实现三维空间任意位置充电

全球第一拍照手机！华为Pura 70 Ultra官方降价：7499元起

充电盒存在冒烟或烧毁风险，铁三角在国内召回无线耳机

华硕 ROG 新品曝光：覆盖 6 款RTX 50显卡型号，预计CES 2025亮相

广东低空经济发展调研报告重磅发布：规模超千亿居全国前列，广深珠三核联动

企业价值止步不前，盐津铺子输在了哪？

魏思琪谈小米SU7熔岩橙：绝对被低估的一款颜色晚上好看得要命

暴增100%？3K、乐牛加码布局！小游戏还有三大机会！

尊界法务开始上班了发现侵权网友已向公安举报处理

11个月，常青游戏赚了400亿！10款游戏进入十亿俱乐部，腾讯网易牢牢把持C位