当前位置: 首页 » 资讯 » 新科技 » 正文

让科幻进一步照进现实,智元发布智元启元大模型

IP属地 北京 编辑:沈瑾瑜 锌财经 时间:2025-03-10 20:00:18

3月10日,智元发布首个通用具身基座模型——智元启元大模型GO-1。相比目前已有的最优模型,GO-1在五种不同复杂度任务上测试成功率大幅度领先,其中平均成功率提高了32%,并且在 “Pour Water”(倒水)、“Table Bussing”(清理桌面) 和 “Restock Beverage”(补充饮料) 任务表现尤为突出。

智元GO-1在复杂任务中的高成功率源于其Vision-Language-Latent-Action (ViLLA) 架构。据了解,该架构由智元开创性采用,是由VLM(多模态大模型) + MoE(混合专家)两种组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。

在推理时,VLM、Latent Planner和Action Expert三者协同工作,实现与外部环境的交互和任务智能化判断。

其实从行业来看,全球具身机器人普遍处在“低龄阶段”,机器人只能在实验室内执行单一任务,并且很多执行动作更多是预设程序,具身机器人只是根据编程命令执行动作,不能与外部环境交互,无法自主执行命令,智能化水平低。

但智元GO-1发布后,具身机器人可在ViLLA 架构的加持下,具备人类视频学习、小样本快速泛化、一脑多形、持续进化四大特征,不仅让大模型更理解人类的行为、大幅度降低训练成本,而且还能再不同机器人形态中迁移,在实际执行中迭代学习。

智元GO-1带给具身机器人的新特征,将极大推动具身机器人行业的发展,未来具身机器人将从依赖特定任务的工具,向着具备通用智能的自主体发展,在商业、工业、家庭等多领域发挥更大的作用,通向更加通用全能的智能未来。

作为全球具身机器人行业领先者,智元始终致力于推动具身机器人行业发展。

2024年年底,智元推出了 AgiBot World,包含超过100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集,收录了八十余种日常生活中的多样化技能,包括抓取、放置、推、拉等基础操作,以及搅拌、折叠、熨烫等交互动作,为行业解决了全域真机数据获取难,训练成本高的难题。

未来已来,机器人服务人类的时代已经不远,而作为具身机器人行业领先者,智元不断实现突破,让科幻电影中的画面逐步照进现实。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新