当前位置: 首页 » 资讯 » 科技探索 » 正文

全国首个!成都创新团队发布机器人多模态模型

IP属地 北京 编辑:刘敏 锦观新闻 时间:2024-08-12 18:12:28

8月12日,成都人形机器人创新中心(简称“中心”)发布最新研发成果:中国首个机器人多模态模型RRMM(Raydiculous Robot Multimodal Model)及双臂协作系统RTACS(Raydiculous Two-Arm Cooperation System)。

据悉,多模态模型(RRMM)能使机器人理解推理抽象的语义指令,并调度双臂协作系统(RTACS)执行任务。“目前仅OpenAI等国外头部企业发布类似成果,这标志中心在我国多模态模型应用于人形机器人领域的率先突破,使‘AI 物理化’进程加速,也让人形机器人从‘预设摆拍’‘遥控操作’进化到拥有更强的‘大脑’和自主执行能力。”中心相关负责人告诉记者。

多模态(即多种异构模态)数据协同推理,能融合两种或两种以上不同感知来源,进行综合推理,并完成复杂任务。例如,最新的ChatGPT4o展示其强大功能时,测试者不用传统的键盘输入问题指令,而是在一张纸上手写一个待解方程,以及手绘一个几何图形并用语音指令要求GPT4o解题,GPT4o通过图像识别、语音识别和语义理解及推理,快速给出准确答案,这就是典型的多模态应用。

那么,如果将多模态应用于人形机器人领域,是否可以让机器人获得自主思考的能力?“多模态可以使人形机器人融合像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,这是人形机器人具有自主思考能力的关键核心技术。”中心负责人解释道。

小锦梳理发现,在成都人形机器人创新中心发布的相关资料中可以看到,语义指令有相对明确的将水果和非水果,饮料和非饮料进行区分和分拣,也有相对抽象的将圆柱体和长方体物体进行区分和分拣,还有比较抽象的把可食用和不可食用物品进行区分和分拣,完成以上任务需要机器人通过多模态模型自主对所有物品进行提取归纳。特别是对多个相似瓶子形状的物体,需进一步通过瓶身包装上的文字、图片等要素综合判断其是否为可食用或非食用瓶装物,才能最终完成任务。

新闻延伸——

该成果来自成都人形机器人创新中心,这是国内唯一致力于研发“真正拥有大脑的人形机器人整机”的人形机器人新型研发机构,开创性推动中国人形机器人产业高质量发展。

成都日报 记者 黄雪松 视频 主办方 责任编辑 常莉娟 编辑 王钟婧玥

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新