当前位置：首页 » 资讯 » 新科技 » 正文

阿里通义千问发布最强视觉理解模型Qwen2-VL-72B！可理解20分钟以上长视频

IP属地北京 编辑：王婷快科技 时间：2024-08-30 17:47:40

8月30日消息，阿里通义千问发布第二代视觉语言模型Qwen2-VL。其中，旗舰模型Qwen2-VL-72B的API已上线阿里云百炼平台。
据了解，Qwen2-VL在多个权威测评中刷新了多模态模型的最佳成绩，在部分指标上甚至超越了GPT-4o和Claude3.5-Sonnet等闭源模型。
2023年8月，通义千问开源第一代视觉语言理解模型Qwen-VL，成为开源社区最受欢迎的多模态模型之一。
短短一年内，模型下载量突破1000万次。目前，多模态模型在手机、车端等各类视觉识别场景的落地正在加速，开发者和应用企业也格外关注Qwen-VL的升级迭代。
相比上代模型，Qwen2-VL的基础性能全面提升。可以读懂不同分辨率和不同长宽比的图片，在MathVista、DocVQA、RealWorldQA、MTVQA等基准测试创下全球领先的表现。
此外，Qwen2-VL可以理解20分钟以上长视频，支持基于视频的问答、对话和内容创作等应用。同时，具备强大的视觉智能体能力，可自主操作手机和机器人，借助复杂推理和决策的能力，Qwen2-VL可以集成到手机、机器人等设备，根据视觉环境和文字指令进行自动操作。
该模型还能理解图像视频中的多语言文本，包括中文、英文，大多数欧洲语言，日语、韩语、阿拉伯语、越南语等。
通义千问团队从六个方面评估了模型能力，包括综合的大学题目、数学能力、文档表格多语言文字图像的理解、通用场景问答、视频理解、Agent 能力。
Qwen2-VL-72B 在大部分的指标上都达到了最优，甚至超过了 GPT-4o 和 Claude3.5-Sonnet 等闭源模型，在文档理解方面优势尤其明显，仅在综合的大学题目方面与GPT-4o 存在差距。
用户可通过阿里云百炼平台调用Qwen2-VL-72B的API：https://help.aliyun.com/zh/model-studio/developer-reference/qwen-vl-api

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

realme 真我 V60 Pro 手机现身电信产品库，售价 1599 元起

系统集成商开启RTX 5090显卡AI工作站预订，8卡配置定价5万欧元

华为与大连化学物理研究所签约合作，共建智能化工大模型

Redmi K80 Pro性能拉满！王腾直呼“狂暴辣完爆13香”

REDMI K80 Pro升级全焦段旗舰三摄：小米15同款浮动长焦

REDMI推出后悔宝：友商骁龙8至尊版机型最高加1000回收

王腾：REDMI K80 Pro香爆了大哥小米15卖得挺贵的

实测华为Mate 70 Pro+，网速竟比Mate 60 Pro快一倍

银嘉金服旗下支付平台付临门及实控人被再次限消，涉案被执行金额超9千万

REDMI K80 Pro：骁龙8至尊版加持大满贯级性能表现

赵明曝光荣耀Magic 7 RSR保时捷版：带来全新大王算法

中国电信沙特公司在利雅得正式成立

微软申请分布式 VR 专利：用户可独立探索他人共享的虚拟世界

星之卡比初代容量只有64KB？游戏容量与内容质量哪个更重要

《英雄联盟：双城之战》剧集遭删减被删内容引发猜测

《银河战士 Prime 2：复刻版》将于2025年发售！高清画面实锤！

TGA 2024重磅升级！全新“玩家之声”奖项即将开启

这款游戏火了！游戏中切尔诺贝利禁区有人非法入内

动画太长？《双城之战》第二季内容被删减

全站最新

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

热门推荐

B&O 发布 Beoplay Eleven 真无线降噪耳机，采用可更换电池

摩托罗拉海外推出Moto AI首次公测，双击手机背部即可随时访问

集大原高铁全线进入运行试验阶段，预计今年年底具备开通条件

搭载高通骁龙 X 系列芯片的笔记本遇冷，三季度仅占 0.8%市场份额

顺丰控股H股挂牌上市，融资额超56亿港元成港股年内第二大IPO

东晶电子股权生变：宁波宁聚助蓝海投控成第一大股东

美国华盛顿装上 AI 防空摄像头，22 年老设备下岗

谁席卷了这个冬天的总裁圈衣橱？

realme 真我 V60 Pro 手机现身电信产品库，售价 1599 元起

系统集成商开启RTX 5090显卡AI工作站预订，8卡配置定价5万欧元

华为与大连化学物理研究所签约合作，共建智能化工大模型

Redmi K80 Pro性能拉满！王腾直呼“狂暴辣完爆13香”

REDMI K80 Pro升级全焦段旗舰三摄：小米15同款浮动长焦

REDMI推出后悔宝：友商骁龙8至尊版机型最高加1000回收

王腾：REDMI K80 Pro香爆了大哥小米15卖得挺贵的