文 | 有界UnKnown,作者 | 山茶,编辑 | 钱江
回顾整个2024年,除了持续发酵的AI大模型之外,人形机器人应该是这一年最具标志性的风口。
事实上,人形机器人的热闹与AI大模型也脱不了干系。
一方面,人形机器人一直被视为AI大模型发展的下一个阶段,为一个智慧的头脑赋予强大身体。大家还为这个新的阶段取了一个更具未来感的名字——具身智能。
但另一方面,人形机器人又像是AI大模型遭遇瓶颈之后的一个新的发展方向。所以在今年7月举办的,以AI为主题的世界人工智能大会上,人形机器人反而喧宾夺主,成为这场盛会的焦点。
总之,回顾2024这一年,人形机器人火得十分仓促,它像是被AI推搡着,被迫地站到前台。
但它又与在这一年里越努力越迷茫的AI大模型不同,人形机器人拥有非常清晰的目标,几乎所有企业都在讲落地、讲应用、讲量产。
据企查查数据,2024年截至11月底,国内新成立的机器人公司达到16.79万家。另据IT桔子数据,2024年有41 家人形机器人企业完成56次融资,融资总额超50亿元人民币。从全球范围内看,这一年更是有80多款各式各样的人形机器人发布。
人形机器人已经不是一个新的产业,如果从波士顿动力成立的那一刻算起,人形机器人已经在历史长河中走过了32年。
但即便如此,2024年也仍然可以被称为“人形机器人元年”。从这一年开始,人形机器人不再是实验室中的冷清身影,而是走向台前,成为全球关注的焦点。
人形机器人,风起大模型
2024年,人形机器人之所以突然被广泛关注,其实和一个关于AI大模型最本质的讨论有关,即如何实现AGI(通用人工智能)。
这两年,在OpenAI举着Scaling Law的大旗高歌猛进之时,关于大模型和AGI一直有一个微弱但坚定的声音,表示OpenAI的方法无法实现AGI。
提出这个观点的是meta首席科学家,被称为人工智能三巨头之一的Yann LeCun。
▲meta Platforms高级研究员Yann LeCun,图源纽约时报
他认为智能不仅仅是大脑的产物,还涉及身体与环境的互动,所以真正的通用人工智能(AGI)应该具备像猫那样探索周围环境并从中学习的能力。
这套理念与主张“智能行为不仅依赖于信息处理能力,还依赖于智能体的感知和行动能力”的具身智能不谋而合。
所以在2023年人们争相讨论GPT到底是不是AGI的时候,人形机器人就已经为2024年的爆发做好了准备。
敏锐的人会很快抓住机会,所以2024年一开始,人们关于AI大模型的讨论就很自然地过渡到人形机器人的身上,并成为驱动人形机器人轰然爆发的第一动力。
2024年3月,被称为是AI大模型最大赢家的黄仁勋带着9个形状各异的机器人登上了英伟达2024年GTC AI大会的舞台,打响了引爆人形机器人的第一枪。
从此之后,各个大厂有头有脸的人物像是商量好一样,开始一起涌入人形机器人的赛道。比如:
资本同样也毫不吝啬。IT桔子数据统计,2024年人形机器人行业41家企业累计完成56项融资,累计融资金额50.95亿元,其中融资超过一亿美金的项目就有17个。
智能,从“大块头”到“小甜心”
人形机器人开始真正意义上火了。
但人形机器人却不是一个初出茅庐的“小子”。如果从1968年,美国通用电气公司(R.Smosher)试制的操纵型双足步行机器人Rig算起,人形机器人已经有56年的历史了。而即便以更多人知道的波士顿动力作为标志,从其创办之日起,到如今也已有了32年的时间。
但在过去的这数十年里,人形机器人的发展却并没有太大突破。其核心的障碍在于,它缺乏一个足够聪明大脑帮助人形机器人实现更强的泛化能力[1]。
直到2023年,AI大模型才为人形机器人的突破带来曙光。
就像是为一块木头注入灵魂,作为专业水平超过大多数专家的神奇算法,大模型完全可以成为人形机器人的大脑,推动人形机器人向着一个更理想状态前进。
事实也是如此,整个2024年,在大模型与人形机器人碰撞同时,软件与硬件也开始融合。
▲Figure01与人类交流,来源YouTube
比如OpenAI就投资了人形机器人公司Figure,并将ChatGPT装进了人形机器人Figure01当中。
有了大模型加持的Figure01,能够将人类的命令轻松转化成任务,比如递一个苹果、放置好盘子,它还可以将咖啡胶囊放进咖啡机,如果胶囊位置偏了,Figure01可以纠正位置。
比如波士顿动力与丰田合作开发“大型行为模型”,一个专属于机器人的ChatGPT,它可以帮助机器人获取不确定性环境中进行随机应变的能力。比如它可以让机器人做酱汁烧注和涂抹任务,机器人可以跟随面团位置的随机移动而挪动勺子。
这样的例子还有很多,上海交大教授卢策吾的穹彻智能具身大脑Noematrix Brain,可以让机器人处理不规则的曲面物体,比如削黄瓜、刮胡子。UnixAI旗下Wanda机器人可以协助人类做豆腐汤,柔性机械手能够“夹豆腐”。
显而易见,在AI大模型的帮助下,人形机器人开始变得更加聪明。它不再是之前只会奔跑、跳跃、翻跟头的“大块头”,转而变成了可以帮助人类叠衣服、做饭、端茶倒水的“小甜心”。
落地,落地,还是落地!
如果你以为这样就是人形机器人的终点,那显然不是。因为这些被拍摄、被展示的灵巧,本质上都是“实验室环境”下的表演。
就像赵括的纸上谈兵,要真正的学以致用,人形机器人还需要更多的数据,更多的经验和尝试。
所以整个2024年,“智能化”之外,人形机器人的第二个关键词就是“进厂打工”。
2024年5月,Tesla Optimus率先在X(原Twitter)平台展示一段擎天柱在特斯拉工厂“打工”的视频,视频里的擎天柱在生产线上分拣电池。不久之后,Figure宣布与宝马签订协议进厂打工,Figure01已经在宝马工厂落地,并且Figure02的续航能力可以支持每天20小时有效工作。
▲擎天柱分拣电池包,来源YouTube
在国内,优必选Walker S、小米机器人铁大、小鹏iron、傅立叶GR-1也都纷纷到工厂拧起了“螺丝”。
这个阶段,人形机器人就像是一个刚刚毕业的大学生,需要通过进厂实习来获取工作经验。
但对于人形机器人企业来讲,仅仅是进厂实习似乎还远远不够,大家似乎都还想要快一点,更快一点。
所以到2024年年底,越来越多人形机器人企业开始宣布“量产”。
在国内,智元机器人年底宣布计划量产近千台商用人形机器人,在这之前,傅立叶、宇树都宣布过量产消息。
国外的量产甚至还要更早一些,曾获得亚马逊1.5亿美金投资的Agility宣布量产人形机器人Digit,Agility甚至在美国俄勒冈州建立世界第一个机器人超级工厂RoboFab,宣称目标一年生产上万台Digit。目前,Digit已开设第一条生产线,配备专门用于组装机器人的头部、手臂、腿部和躯干的工作站。
量产,对于硬件企业来说是一个非常重要的词汇,通常它代表着技术成熟,商业场景闭环、应用稳定,所以企业才通过大规模制造来摊薄成本。而从企业的发展阶段来讲,也意味着企业走过了早期的研发投入阶段,开始大规模创造收入。
从一个旁观者的视角,人形机器人在2024年年初开始占上风口,许多追风者2024年年中才陆续成立公司,而到了年底,许多企业却已经开始量产了。
所以回顾整个2024年,从智能化到进厂打工,再到推动量产,我们发现整个人形机器人行业都凸显出一种争分夺秒的紧迫感。
这种紧迫感,来自于人形机器人企业迫切地想要落地,想要应用,想要向市场证明自己的价值。
从理性的角度看,这样的紧迫感多少让人觉得企业有些太过着急,而对技术发展缺乏耐心。但如果回顾人形机器人的发展路径,我们其实又能对这种着急表示理解。
毕竟因为不赚钱,过去30年里人形机器人已经受尽了“白眼”。波士顿动力从2014年被谷歌收购,又在2017年被卖给软银,最后在2021年被转手给韩国现代,就是这种“白眼”最真实的写照。
波士顿动力成为一个“四手公司”其实就在说明一个商业世界里最根本的问题,即技术如果不能与产业结合,不能创造商业价值,那再先进的技术也没有意义。
类似的,2023年以来,AI大模型的发展轨迹也在论证同样的道理。
所以,这一批人形机器人公司,在这个问题上其实已经想得非常清楚。他们深刻地认识到实现真正的具身智能是一个漫长而艰苦的过程。
而越是这样,他们就越需要争分夺秒的落地,去向市场、向资本证明自己,从而获得更持久的耐心与更长期的资金支持。
这是一个现实的问题,也是整个2024年人形机器人行业的底色。
创新中心和产业催化剂
具体来看,对比2024年中美两国人形机器人产业的发展轨迹,中国人形机器人产业的发展仍然体现出非常鲜明的中国特色。
而这个特色具体就落在“创新中心”上。
创新中心最早由国家发改委在2018年提出。这些年来,国家重点扶持的各个行业里,或多或少都有创新中心的影子。
但与过往创新中心往往隐藏在企业背后不同,整个2024年,人形机器人创新中心的出镜频率,要远远超过这个行业里的大部分企业。
从2024年年初开始,全国各地的人形机器人“创新中心”就开始纷纷成立。据「有界UnKnown」不完全统计,截至2024年底,从国家到地方,已成立的“人形机器人创新中心”已经达到9个。
各地积极成立人形机器人创新中心,一个重要的原因是想以创新中心为抓手,带动当地人形机器人产业链的发展。这一点「有界UnKnown」年中的文章中已经提到。
但除此之外,人形机器人行业仍然面临许多挑战,其中在行业基础设施的建设方面缺口尤为明显,比如具身智能数据集、具身智能大模型、仿真场景与数字孪生、开源社区等等。
而研发基础设施与平台的建设,是降低研发门槛、扩大产业规模和提高产品性能的前提,对实现产业规模化和商业化起到关键作用。但这些问题单纯依靠市场化的力量很难快速实现突破。
所以2024年,创新中心就承担这样一个建设行业基础设施的角色,我们将其主要工作概括为三个部分。
其一是建立开源生态。
开源生态通过共享代码、工具和资源,降低研发成本,加速新技术的商业化进程。从过去二十多年信息技术的发展历程看,开源生态在产业发展过程中都扮演者重要的角色。
在人形机器人领域,开源生态的建设涉及硬件、软件、数据,以及开源社区等多个部分的建设。
今年7月份,位于上海的国家地方共建创新中心(以下简称上海创新中心)在WAIC上发布了国内首款全尺寸通用人形机器人公版机“青龙”,并对齐进行开源。
▲上海创新中心青龙机器人,来源CSDN
到年底的11月份,位于北京的国家地方共建具身智能机器人创新中心(以下简称北京创新中心)也宣布了天工开源计划,将陆续开源其旗下人形机器人“天工”的结构图纸、软件架构、电气系统、数据集、运动控制训练框架等内容。
此外,北京创新中心还计划联合高校、科研院所、集成商等具备人形机器人二次开发能力的机构,共同打造具身智能开源开放社区。而在更早之前,上海创新中心则上线了全尺寸人形机器人开源社区“OpenLoong”。
有机器人领域的从业者向「有界UnKnown」表示,当前国内人形机器人还处在非常早的阶段,因此许多企业都在攻克同样的问题,重复造轮子,开源生态的建立能够帮助企业减少相关的重复投入,从而将有限的资源集中在解决专有技术上。
其二是机器人训练与数据采集。
如大模型训练一样,人形机器人训练也需要非常庞大的数据支持。但又与大模型可以通过公共互联网采集数据不同,人形机器人的每一段数据都需要专门采集。但由于训练数据采集成本高昂,因此也成为制约当前人形机器人发展的一个重要因素。
在上海浦东张江,上海创新中心二楼有一个专门的场地,用作给各大人形机器人企业训练和数据采集使用。2024年全国各地已有多家厂商将自家的人形机器人送到这里集训。
上海创新中心总经理许彬表示:“组建机器人训练场是国地中心今年(2024年)下半年最重要的工作之一,这主要是为了解决当下对人形机器人发展形成掣肘的场景落地和数据不足问题。"
按照规划,这个训练场将落地在浦东张江模力社区,可容纳100个人形机器人同时训练,并计划在2027达到1000个。
而除了实地训练场地,各地的创新中心也在积极搭建虚拟训练场地。
比如北京创新中心在2024年4月就启动了具身智能数据集与数据应用平台建设。一个月之后,上海创新中心推出了“开源道场”MiniDojo,成为国内首个首个对标特斯拉虚拟训练场Dojo的原型。
第三是制定标准。
比如,为解决以双足、四足为代表的具身智能机器人腿式机器人运动性能指标不统一、试验条件不一致、测试方法不规范等问题,北京创新中心参与发布国家标准《腿式机器人性能及试验方法标准》。比如为解决数据采集不规范的问题,北京创新中心联合11家数据集共建单位,牵头编写国内首个具身智能数据采集标准。以及为了规范行业评级与机器人应用落地,北京创新中心联合业内多家权威机构起草了《人形机器人智能化分级》标准。
除此之外,创新中心还在建设人才培养体系、投资孵化等方面发挥作用。
比如上海创新中心与上海大学合作,推动全国首个人形机器人本科专业在上海落地,以及联合上海市组建一个百亿基金,帮助更多初创企业能够进入机器人赛道。
总而言之,整个2024年,创新中心专注于解决发展具身智能机器人关键共性技术问题。它就像是一个企业内部的研发中台,通过充分调动市场资源,为人形机器人行业的发展起到一个加速作用。
他们不是要孵化一家、两家有竞争力的人形机器人企业,而是要打造一个有竞争力的人形机器人产业生态链。
这与美国人形机器人行业依靠特斯拉、Figure和OpenAI的顶尖企业带动不同。中国人形机器人行业的发展,体现出了一种“集中力量办大事”的特点,这一直是中国的制度优势,而这种优势在人形机器人的产业发展中也得到了充分的展示。
人形机器人,走出中国节奏
总而言之,在创新中心的推动下,也在于国内创业公司的努力,人形机器人虽然发源于欧美,但2024年中国在人形机器人赛道上的进步也可以称得上独树一帜。
这一点在人形机器人企业数量上可以得到一些体现。
根据M2 Consulting的数据,2024年全球人形机器人整机企业总数超过150家,其中中国、美国和日本的企业数量占全球份额超过65%,而中国拥有43家人形机器人整机企业,成为数量最多的国家。
这一点,源于中国过去在机器人产业上积累下来的优势。毕竟中国已经连续多年蝉联世界第一大机器人生产国,拥有坚实的产业链支持。
举一个简单的例子,人形机器人最烧钱的核心零部件分布在执行器,三大执行器(线性执行器、旋转执行器、 灵巧手)占人形机器人主要零部件价值量的73%。
与欧美国家相比,中国的执行器具备成本优势。根据《2024年人形机器人核心执行器市场分析报告》,中国的制造成本普遍比欧美低30%-40%。
除了核心零部件成本上的优势外,中国还拥有广阔的人形机器人消费市场。
不提未来前景广阔的人形机器人家庭应用场景,仅以目前大多数机器人进厂打工的目的地——汽车工厂为例。
据乘联会的数据,从2020年起,中国汽车销量占世界销量的份额就持续上升,在2023年达到33.8%,2024年进一步上升至34.1%。在新能源汽车领域,2024年1月~11月,中国在世界新能源汽车市场的份额已达到70%。
这些优渥的条件让中国市场也对人形机器人的应用有了更高的期待。
自工业社会以来,中国的科技发展之于西方就一直是一个跟随者的角色,“copy to china”是这些年里的一个重要底色。
2022年底,大模型横空出世,中国产业界一度非常兴奋。
其中一个原因是,相比之前多次技术革命中,中国都因为各种原因而错过,或者珊珊来迟不同。这一次以大模型为代表的AI技术革命,让中国可以真正意义上与欧美站在同一起跑线上。
在最激动的时候,中国科技界许多有头有脸的人物都喊出中国的AI大模型与美国只有五个月差距的口号。可以说,这是我们第一次距离一直追逐的对手如此之近。
但经过近两年的发展,所谓五个月的时间差距或许并不客观,而且这种差距,随着时间的发展,甚至有一些越来越大的感觉。在这样的背景下,人形机器人的出现让中国的产业界又看到一个新的希望。
与AI的发展受制于数据、芯片等关键技术不同。在人形机器人领域,中国不仅拥有产业链上的优势,还没有太多关键技术上的桎梏。
这一次,中国和欧美真站在了一条非常接近的起跑线上,中国在人形机器人领域比在AI大模型领域更有希望引领世界。
回顾整个2024年,在全国各地创新中心的推动下,在中国人形机器人企业的不断努力下,中国人形机器人产业已经初具规模,并且逐渐走出自己独特的节奏。
但作为实体产业,人形机器人显然也很难同互联网、AI等以软件应用为主的行业一样,经历一个快速爆发的时期,其庞大的产业技术设施,和关键技术的突破都需要大量的时间进行培育。
因此,我们相信人形机器人产业会有一个广阔的前景,但我们同样也需要尊重实体产业的发展规律,给予更多地耐心和支持。