"
物理AI终极形态,相当于从培养只会读书的天才,变成培养一个“能跑能跳、会犯错会学习的人类孩子”,就算它开始是个“学渣”,也必须是具备行动能力的“全能学渣”。
"
搅翻AI界的DeepSeek,团队140人,创始人梁文锋是中国80后。
机器人上春晚的宇树科技,研究通用机器人G1时只有3名专员,参与者不过10个,创始人王兴兴是90后。
当DeepSeek把语言大模型顶流OpenAI拉下神坛,一个合理推测,DeepSeek如果同宇树科技联手,有可能研发出真正的物理AI通用大模型,也就是机器人大模型。
用美国AI教父黄仁勋的话,叫做“宇宙大模型”。埃隆马斯克xAI想干,他不久前发布Grok3,目标也是这个。
谁更快呢?中国90后和80后显然效率更高。梁文锋和王兴兴,能把70后马斯克干退休吗?
1.AI研发不神秘,别让大神们带歪了
现在搞AI都有光环,黄仁勋、奥特曼、马斯克们,这些硅谷精英名字如雷贯耳,被神话了。
高智商、大志向、巨额资本追捧,指明人类文明前进方向……但2025很骨感,中国出来一群年轻人,嘁哩喀喳一顿神操作,把神话人物们的高大上项目,打出了原形。
AI到底是什么?理解AI产业,先弄懂基础知识。基础知识不需要专业术语,需要退休的咱爸咱妈都明白的简单道理。
AI是人工智能(Artificial Intelligence)英文缩写,就是“人造的智能”。直白一点,人想造出来跟自己一样聪明的机器。那么,你就必须明白,人的智能怎么来的?人为什么聪明?
有一篇目前为止最棒的理解人类思维与智慧的文章——《人的正确思想是从哪里来的?》,是这么解释人类智慧源头的。摘录如下:
●人的正确思想是从哪里来的?是从天上掉下来的吗?不是。是自己头脑里固有的吗?不是。人的正确思想,只能从社会实践中来。
●无数客观外界的现象通过人的眼、耳、鼻、舌、身这五个官能反映到自己的头脑中来,开始是感性认识。这种感性认识的材料积累多了,就会产生一个飞跃,变成了理性认识,这就是思想。这是整个认识过程的第一个阶段,即由客观物质到主观精神的阶段,由存在到思想的阶段。
●然后又有认识过程的第二个阶段,即由精神到物质的阶段,由思想到存在的阶段,这就是把第一个阶段得到的认识放到社会实践中去,看这些理论、政策、计划、办法等等,是否能得到预期的成功。一般的说来,成功了的就是正确的,失败了的就是错误的。这是第二次飞跃。
●一个正确的认识,往往需要经过由物质到精神,由精神到物质,即由实践到认识,由认识到实践这样多次的反复,才能够完成。对于物质可以变成精神,精神可以变成物质这样日常生活中常见的飞跃现象,有很多人觉得不可理解,但这就是人类认识论的道理。
好,感性认识、理性认识、认知飞跃、实践检验、多次反复,抓住这几个关键词,今天AI大神们讲的技术天书,其实就没什么稀奇了。
有个细节要清楚,与人的学习和思维养成不同,AI是从语言学习开始的,也就是从理性认知起步。
因为它是机器,不是人类小孩。小孩子的学习,是从叫爸爸妈妈、吃奶吃饭、走路摔跟头开始的,这些基本是感性认识。
但AI从一开始就被装入人类的语言和知识,它是从“书本学霸”的理性认知开始变聪明的。所谓“语言大模型”就这个意思
2.从“书本学霸”到“全能学渣”
学会说话,人有了思维力。学会走路,人就有行动力。
AI也一样,只会说不会跑,只会想不会干,“语言大模型”再牛掰都是残疾人。“机器人大模型”研发出来,AI才能真正长大。陆游有一句诗,“纸上得来终觉浅,绝知此事要躬行”。
当下ChatGPT们就像一个“超级学霸”,它读完了世界上所有的书,能通过文字理解知识、写文章、解题,甚至模仿人类的逻辑推理。但它只是一个瘫坐在图书馆里的学霸,知识渊博却无法走出房间。
这样的“学霸”,比那些会玩会闹、会跑跳投、会干坏事儿的“学渣”们差远了!
物理AI,也就是具身智能,或者叫“机器人大模型”,大目标是让学霸变成一个“全能运动员”,既能读书思考,又能跑步、打球、做实验,甚至通过亲身体验总结物理规律。
需要做些什么呢?
从纸上谈兵到动手实践。物理AI需要像人类一样,通过眼睛看苹果的颜色、用手感受苹果的重量和质地,甚至咬一口知道它是脆的甜的。
从静态知识到动态适应。机器人能否“吃一堑长一智”?被门夹了一次手,下次开门时会主动放慢动作、试探空间,物理AI必须要给它赋能高效学习反馈的算法。
从虚拟世界到“物理肉身”。需要开发像人类皮肤一样敏感的电子触觉传感器、像肌肉一样柔韧的驱动装置,甚至设计接近人脑能效比的超级AI芯片。(千万别以为英伟达芯片有多牛,眼下最棒的AI芯片,能耗比与人脑差距也在万倍以上。)
从单一任务到通用智能。物理AI需要成为“通才”,既能拧螺丝修车,又能照顾老人,还能在陌生环境中探险。
以上这些,就类似黄仁勋说的“宇宙大模型”,它需要像人类一样,掌握一套理解世界的基础规律,比如重力、摩擦力、材料特性,并灵活组合这些知识,应对新场景。
火爆的语言大模型只会“理性思考”,物理AI却要“感性实践”,既要读万卷书,也要行万里路。
通俗说,物理AI终极形态,相当于从培养一个只会读书的天才,变成培养一个“能跑能跳、会犯错会学习的人类孩子”,就算它开始是个“学渣”,也必须是一个具备行动能力的“全能学渣”。
3.王兴兴+梁文锋=超越马斯克
马斯克自始至终都明白,他布局特斯拉自动驾驶FSD,下注Optimus机器人,尤其是xAI快速升级Grok3大模型,目标都是物理AI。
但显然,距离理想效果差太远了。
梁文锋DeepSeek展现了更高效的算法。王兴兴机器人G1迭代速度更快、成本更低。中国80后和90后如果联手,加上中国为最丰富的工业和产业应用场景,通过数据“饱和式喂养”,会怎么样?
首先,宇树机器人采用“端到端AI控制”,抛弃传统机器人分层的“大脑-小脑”架构,直接通过强化学习训练整体运动模型,算法迭代周期缩短至周级别。
成本方面,自研电机、3D激光雷达等核心部件,G1售价9.9万元人民币,而马斯克Optimus预估价格60万美元。如果量产,“中国速度”不是产业空心化的美国能比的。
DeepSeek纯强化学习方法(GRPO算法)属于“自生长”模型,这与物理AI所需的“自主探索物理规律”的特性高度契合——正如人类通过试错理解世界,DeepSeek的算法框架,天然适配物理交互中的动态反馈机制。
更重要的是,DeepSeek算法已成功迁移至多模态领域,具备“文本-视觉-物理参数”(VLA)的贯通性,它在复杂场景下的泛化学习能力远超传统方法,这是构建世界大模型的关键基础。
其次,两者如果结合,宇树机器人G1支撑多场景动态物理数据采集反馈,能让DeepSeek获取多场景物理耦合数据,形成“感知-决策-执行”全链路训练集。
而中国各类软硬件企业都在部署DeepSeek,像拼多多之类的大型电商网站数据、大疆无人机群实测数据、长三角电网调控数据、宁波港物流数据等,还有各类线下线上的应用场景产生的数据,都可能给DeepSeek创建物理AI提供“跨域验证场景”。
第三,有人预测,未来两年如果宇树机器人G1在100家工厂规模化部署,通过数亿小时物理交互数据训练,有可能率先突破“具身智能”模型搭建。
中国特色“国家算力基建+市场化敏捷研发”协同模式,给DeepSeek训练物理AI大模型喂养“高精度+高速度”数据,DeepSeek有70%概率2026年前完成物理AI算法重构。
这样,王兴兴+梁文锋组合,极有可能用“真实物理世界倒逼算法进化”策略,以“开源模型+工业场景”组合拳,在物理AI赛道撕开突破口。
某种意义上说,中国80后和90后不需要理解所有物理定律,只需让机器人AI在真实世界中“暴力试错”,物理大模型就能自己浮现。
从中美AI竞赛角度看,谁能更快建立“物理规律-AI模型-产业落地”三位一体循环体系,谁就能主导“世界大模型”的话语权。黄仁勋的预言早晚“理想照进现实”,大概率会以东经120度为坐标原点。
70后马斯克足够聪明,不可能不了解这样的现实,用“第一性原理”就能推导出来。
他当然不想被干退休,要么xAI招聘那么多华人程序员干啥?!
本文仅为作者个人观点,不代表水滴汽车立场。