当前位置：首页 » 资讯 » 新科技 » 正文

阿里通义千问开源第二代视觉语言模型支持超20分钟长视频问答与内容创作

IP属地北京 编辑：李娜太平洋科技 时间：2024-09-02 22:16:03

阿里云通义千问最近宣布开源了第二代视觉语言模型Qwen2-VL。与上一代模型相比，Qwen2-VL在多个方面实现了性能的全面提升。它能够读懂不同分辨率和不同长宽比的图片，在DocVQA、RealWorldQA、MTVQA等基准测试中取得了全球领先的表现。此外，它还能理解超过20分钟的长视频，支持基于视频的问答、对话和内容创作等应用。
Qwen2-VL推出了2B、7B两个尺寸的模型及其量化版本。此外，旗舰模型Qwen2-VL-72B的API已经上线阿里云百炼平台，用户可以直接调用。
此外，Qwen2-VL还具备强大的视觉智能体能力，可以自主操作手机和机器人。它能够集成到手机、机器人等设备中，根据视觉环境和文字指令进行自动操作。
该模型能够理解图像和视频中的多语言文本，包括中文、英文、大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。
Qwen2-VL延续了ViT加Qwen2的串联结构，三个尺寸的模型都采用了600M规模大小的ViT，支持图像和视频统一输入。为了更清楚地感知视觉信息和理解视频，团队在架构上进行了一些升级，包括实现了对原生动态分辨率的全面支持和多模态旋转位置嵌入(M-ROPE)方法。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

realme 真我 V60 Pro 手机现身电信产品库，售价 1599 元起

系统集成商开启RTX 5090显卡AI工作站预订，8卡配置定价5万欧元

华为与大连化学物理研究所签约合作，共建智能化工大模型

Redmi K80 Pro性能拉满！王腾直呼“狂暴辣完爆13香”

REDMI K80 Pro升级全焦段旗舰三摄：小米15同款浮动长焦

REDMI推出后悔宝：友商骁龙8至尊版机型最高加1000回收

王腾：REDMI K80 Pro香爆了大哥小米15卖得挺贵的

实测华为Mate 70 Pro+，网速竟比Mate 60 Pro快一倍

银嘉金服旗下支付平台付临门及实控人被再次限消，涉案被执行金额超9千万

REDMI K80 Pro：骁龙8至尊版加持大满贯级性能表现

赵明曝光荣耀Magic 7 RSR保时捷版：带来全新大王算法

中国电信沙特公司在利雅得正式成立

微软申请分布式 VR 专利：用户可独立探索他人共享的虚拟世界

星之卡比初代容量只有64KB？游戏容量与内容质量哪个更重要

《英雄联盟：双城之战》剧集遭删减被删内容引发猜测

《银河战士 Prime 2：复刻版》将于2025年发售！高清画面实锤！

TGA 2024重磅升级！全新“玩家之声”奖项即将开启

这款游戏火了！游戏中切尔诺贝利禁区有人非法入内

动画太长？《双城之战》第二季内容被删减

全站最新

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

热门推荐

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

realme 真我 V60 Pro 手机现身电信产品库，售价 1599 元起

系统集成商开启RTX 5090显卡AI工作站预订，8卡配置定价5万欧元

华为与大连化学物理研究所签约合作，共建智能化工大模型

Redmi K80 Pro性能拉满！王腾直呼“狂暴辣完爆13香”

REDMI K80 Pro升级全焦段旗舰三摄：小米15同款浮动长焦

REDMI推出后悔宝：友商骁龙8至尊版机型最高加1000回收

王腾：REDMI K80 Pro香爆了大哥小米15卖得挺贵的