当前位置: 首页 » 资讯 » 科技探索 » 正文

全国首个 成都创新团队发布机器人多模态模型

IP属地 北京 编辑:赵静 爱看头条 时间:2024-08-13 09:54:57

中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣

如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描绘的美好未来,正加速向我们走来。

记者昨日获悉,8月12日,成都人形机器人创新中心发布最新研发成果:中国首个机器人多模态模型RRMM(Raydiculous Robot Multimodal Model)及双臂协作系统RTACS(Raydiculous Two-Arm Cooperation System)。

据悉,多模态模型(RRMM)能使机器人理解推理抽象的语义指令,并调度双臂协作系统(RTACS)执行任务。目前仅OpenAI等国外头部企业发布类似成果,这标志着成都人形机器人创新中心在我国多模态模型应用于人形机器人领域的率先突破,使“AI 物理化”进程加速,也让人形机器人从“预设摆拍”“遥控操作”进化到拥有更强的“大脑”和自主执行能力。

多模态(即多种异构模态)数据协同推理,能融合两种或两种以上不同感知来源,进行综合推理,并完成复杂任务。例如最新的ChatGPT4o展示其强大功能时,测试者不用传统的键盘输入问题指令,而是在一张纸上手写一个待解方程,以及手绘一个几何图形并用语音指令要求GPT4o解题,GPT4o通过图像识别、语音识别和语义理解及推理,快速给出准确答案,这就是典型的多模态应用。多模态应用于人形机器人领域,使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,这是人形机器人具有自主思考能力的关键核心技术。

目前,成都人形机器人创新中心发布的中国首个机器人多模态模型,可以相对明确地将水果和非水果、饮料和非饮料进行区分和分拣,也能相对抽象地将圆柱体和长方体物体进行区分和分拣,还能比较抽象地把可食用和不可食用物品进行区分和分拣。完成以上任务需要机器人通过多模态模型自主对所有物品进行提取归纳,特别是对多个相似瓶子形状的物体,需进一步通过瓶身包装上的文字、图片等要素综合判断其是否为可食用,才能最终完成任务。

今年4月12日,成都人形机器人创新中心有限公司取得营业执照,标志着中西部地区首个人形机器人新型研发机构正式落地。该创新中心专注于人形机器人产业的核心技术攻关、成果转化以及产业化。今年,四川省将人工智能列为全省1号创新工程,成都今年初出台的《关于前瞻培育未来产业构筑高质量发展新动能的实施意见》《关于前瞻培育未来产业的政策措施》,也将人形机器人列为重点发展的未来产业之一。“作为目前国内唯一致力于研发‘真正拥有大脑的人形机器人整机’的新型研发机构,我们将持续开创性地推动中国人形机器人产业高质量发展。”创新中心团队负责人表示。

成都日报锦观新闻记者 李艳玲 黄雪松 文/图

编辑:段琪琳 责编:高婷 覃峰

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新