当前位置: 首页 » 资讯 » 智能车 » 正文

百人会论坛丨面壁智能李大海: 隐私和可靠性都需要通过端侧模型来达到

IP属地 北京 编辑:冯璃月 汽车咖啡馆 时间:2025-04-01 12:30:42

编者按:2025年3月28-30日,中国电动汽车百人会年会论坛在钓鱼台国宾馆举办。作为战略合作媒体,搜狐汽车对本次论坛进行全程视频直播,以及短视频报道和参与企业嘉宾采访等环节。本次受访嘉宾是面壁智能CEO李大海。

面壁智能CEO李大海

出品 丨 搜狐汽车·

作者 丨 李德辉

“隐私和可靠性都需要通过端侧模型来达到。”面壁智能CEO李大海表示,这是云端模型和端侧模型在能力上的区分之一。

这也是业界讨论云端模型和端侧模型是否存在替代关系的答案之一。

李大海强调,两者更多是协同关系。

基于提高用户体验的基本原则,大模型只有更懂用户才能提供更好的服务能力。

然而,“(云端)对用户越多的理解就意味着用户隐私信息越多的暴露。”李大海认为:“云端不应该对用户有太多的理解。”

相应的,“云端的AGI就是要全知全能,能够做非常复杂的工作,能够比人思考的能力上限和效率都要更高更强,所以在云端它应该把复杂的工作全做掉。”

具体到端侧模型,“端侧重点要做好的事情就是灵敏的感知。基于灵敏的感知做出符合这个感知就像符合人类直觉的决策,再去做敏捷的行动。”

两者协同在一起,对应的是人类大脑和小脑的智能。

官方信息显示,面壁智能是一个清华孵化的基座大模型公司,于2024年月开始聚焦到端侧大模型。成立至今,面壁智能已经发布了9个端侧模型,多个具备行业领先水平,比如第一个在端上达到GPT-3.5水平的模型、第一个端侧全模态模型、第一个端侧多模态感知模型等。

具体到汽车领域,面壁智能在2025年发布了名称为cpmGO的超级助手,应用在汽车的智能座舱上。

以下是采访速记(经编辑):

Q:您认为云端大模型和我们做的端侧大模型在接下来的技术重点能力演化方面会有什么样的区别?我们这边的重点会是什么?我看到您前段时间说大模型是持久战,接下来您觉得这个持久战最关键的是什么层面?比如去年一直都在说应用,但其实今年大家发现技术好像也还是在不断往前推进,技术的进军并没有走到这个尽头。您觉得接下来的关键是什么?我们作为一个创业公司在这方面最核心的优势会是什么?

李大海:我觉得创业公司的优势主要还是认知跟能力。我们要有足够高的认知高度和足够高的人才密度,认知密度跟人才密度。我们在资金密度上是不可能跟大厂比较的。我们不会选到一个领域最后是跟大厂拼资金。如果进入这样的领域,任何一个创业公司最后的结果都不会好,一定是要在认知密度和能力密度更有优势的领域去构建自己的优势,这是我个人的理解。

您前面提到技术趋势,您刚刚的问题就会涉及到云和端的分工跟协同。我们说云端的模型会越来越强,云端的AGI就是要全知全能,能够做非常复杂的工作,能够比人思考的能力上限和效率都要更高更强,所以在云端它应该把复杂的工作全做掉。端侧发展的趋势是什么呢?因为端侧有隐私、有感知所需要的可靠性,所以端侧重点要做好的事情就是灵敏的感知。基于灵敏的感知做出符合这个感知就像符合人类直觉的决策,再去做敏捷的行动,这个是最最重要的事情。

在这个过程中可以有一些深度思考,但是这个深度思考不应该花太多时间,这是端侧该做好的事情。在这个基础上,端侧还应该做好的是越来越懂用户,懂用户这件事情,就像我们现在人的分工。一个公司如果有一个CEO,那CEO需要一个助理,这个助理不需要是全知全能,所有的专家,但是他知道公司里面每个领域的专家在哪里。当CEO有一个工作需要分配下去的时候,他知道怎么协同把这些人组织在一起,得到想要的答案,分解完工作以后得到想要的答案再给到CEO就可以了,这就是我们说的端和云协同主要的意义。

Q:我们的模型在提供通用能力基础上,如何满足车企的差异化和个性化需求?

李大海:昨天有位同行是做智驾的,他的分享我特别认同,他说人工智能时代,人工智能其实是在逼近事实真相。从座舱角度来看,因为当前是早期阶段,大家都在让它成为一个更好的智能座舱方向上找自己点状的探索。每一个所谓的自己的差异其实都是这个点状探索的过程,但最终这些点状探索会越来越密集,就像一块石板上,下雨时候开始只有小的雨点,但是雨下得越来越大,最后整个石板都会被打湿一样。创新探索一开始是点状的,最终一定会连成一片,当连成一片的时候,在智能化这个事情上是没有太多差异化可言的。这是未来的终局。

未来真正谁更懂用户,能够做到在这些层次上更了解你的用户,让用户觉得宾至如归,这样的黏性就会更强。这个过程中谁能够从点状推进到面状,能够有更好的性价比、更快的速度。这些是过程上能够竞争的点,这是我个人的看法。

Q:您觉得我们的端侧模型跟DeepSeek相比,在落地车企方面会有什么样的区别或者差异?

李大海:端侧AI指的是我在终端上把AI落地,接入DeepSeek一定是一种方式,是最快的,接入云端一定是重要的,但是我们仍然需要端侧的模型原生的方式去做协同。纯云端方式有很多问题解决不了,比如说弱网的问题、比如和隐私相关的问题,这些问题其实都是不能解决的。

我知道2024年曾经出现过一到两次全国影响力比较大的舱内用户隐私信息泄露事件。这肯定不是大家主观想去泄露,一定是因为出了事故,但是背后暴露出来的问题就是舱内隐私数据暴露面太广,容易产生泄露。如果舱内敏感的影像、声音和语言信息都只能舱内处理完,不上传到云端,它的暴露风险就会小很多,隐私和可靠性都是需要通过端侧模型来达到的。纯云端是做不到的,所以云跟端最后要协同,端侧把刚才讲的端侧该做好的事情做好,包括理解用户都应该是端侧去做的,云端不应该对用户有太多的理解,对用户越多的理解就意味着用户隐私信息越多的暴露,它是一个硬币的正反面。

Q:您2025年全员信当时提到过深化汽车业务,您可以具体谈一谈指哪些方向吗?包括咱们接下来会不会推出汽车模型?

李大海:面壁是一家基座模型公司,我们现在在做的事情主要还是端侧大脑。大脑主要要做好感知、做好决策和做好行动,从大脑的角度来讲,这个行动一般都是更抽象的行动,比如我要喝水,我要拿杯子,但具体这个杯子的轨迹怎么做到,这其实是小脑在做的工作,所以我们端侧大脑要跟小脑互动。

在汽车上,我个人理解智驾其实就是汽车的小脑。端侧大脑主要感知环境,感知用户意图,把这些用户意图转化为让小脑理解的指令,让小脑执行。我们在智驾上不会做智驾相关的工作,我们重点是做座舱的工作,最终这个座舱一定要跟智驾协同,未来用户的指令应该要包含所有的指令,包括对智驾的指令。

我举几个简单的例子,大家比较好理解。

第一个,驾驶员或者乘客说我现在有点晕车,你开慢点,就是这样一个指令,它应该马上反映到智驾系统上,智驾策略应该用平缓的策略,不用管别人加不加塞。但是忽然有个车从前面加塞进去,他很生气说,以后跟紧一点,不要让车再加塞,它马上换成更激进的跟车模式,或者帮我停在前面路边红色衣服的女士旁边,这些都应该是通过座舱感知和跟用户的交互去影响智驾很典型的例子。这个是我们要做的事情分界是比较清晰的,我们不会碰智驾,但是我们最终要跟智驾协同。

Q:我们主要在座舱,跟智驾进行融合,您觉得现在比较大的难点和挑战在哪里?我们是怎么样克服和应对的?

李大海:重点还是要跟合适的合作伙伴一起去推进。这个工作节奏上是不会这么快的。因为它涉及到两个复杂系统,不是今天我们发布的产品范围里面的工作,是后续产品规划里面需要大家期待的点。现在还没有更多信息可以分享。

Q:您之前有说现在在团队建设方面对于人才的把控和培养是比较重要的,想问一下我们在这方面今年做哪些重点布局?

李大海:我们在公司里面,我提得最多的一个词叫“AI原生”。我非常鼓励在公司内部让同事们使用AI原生方式去解决问题。大家可以看到有一个特别明显的趋势,随着AI能力越来越强,解决问题的价值在降低,提出问题的价值在提升,我说这个不知道大家好不好理解。未来AI能力的越来越强,你提出一个问题AI都能把问题解决好,AI解决问题的代价是算力,而且算力越来越便宜。你需要花费的价值是越来越低的,任何一个人只要提出一个问题以后,这个问题被解决掉它的价值都是完全可衡量的。

一方面我们需要培养每个同事提出问题的能力,这个是特别重要的一件事情;另外一方面,我们自己作为一家模型公司,我们非常鼓励我们的工程师通过各种创新方法让我们的模型具备更强的解决问题的能力,这是我们培养组织的两个方向。

Q:我们主要的功能实现是在舱内多模态交互,可以这样理解吗?

李大海:当前可以这么理解,但是我们要展望未来的愿景。我们认为未来汽车一定会变成一个超级智能体,就像大家在科幻电影《钢铁侠》里见到的贾维斯。每个人车上都会有一个贾维斯,对你非常关注,知道你的喜好是什么,知道你的行程,能在车上协助你做很多很多工作,懂你,对你和你的朋友,还有周围环境灵敏感知。通过这个感知能够先你一步想到你想做的事情,帮你把它完成。这个不仅仅是感知,最后是一个非常非常让你离不开的个人助理,一个离不开的超级智能体,这是智能座舱的演进方向,这也是我们努力的方向。

Q:我们获取舱内交互数据,还有整车对外的感知数据?

李大海:是的,我们现在跟我们的客户一起往下推进。第一,做舱内跟用户的交互,第二,通过舱内舱外已经有的摄像头等等这样一些感知器,去获得声音跟图像信息,去感知环境,感知完环境以后,去触发一些我们认为该做的事情。

举个例子,比如我们跟一个客户在推进的一个工作,我们通过舱外摄像头,复用智驾的摄像头,感知到我们前面的路段是有施工,这时候就可以给用户提示说前面有施工路段,可能有扬尘,你要不要把窗户关上,打开内循环,这个不仅仅是感知,它是三位一体的,感知、决策、行动,用户说好,就自动把这些工作全都做了。

搜狐汽车:现在比如说像理想,他们提VLA,前端基本全是视觉感知,没有加入多模态的语音对整个智驾功能的调度,但是像极氪他们提MLLM,前端多模态输入,后端是模型输出,您刚才提到我们不去碰智驾,这相当于我们的交互数据不在整车端到端整体的模型里面,我们在它的智驾是端到端,但是端到端之前还是要有一个接口的逻辑,是这样吗?比如您刚才举的例子,我的车停在前面穿红色衣服女士的旁边,我给它一个指令,但是这个指令是在车本身端到端智驾行驶能力之前额外输入一个,跟所有其他感知实际是两条路径,以前大家在讲感知如何,摄像头是一个,激光雷达是一个,现在我们又加了一个语音?

李大海:首先整个架构是一直在演进的,我们现在看当前的架构,目前比较合理的架构是大脑跟小脑会共享一些传感器,比如舱内舱外摄像头都可以复用,让大脑感知到,也让智驾感知到,您说到端到端主要指端到端的智驾。

我们现在在做的是端到端的大脑,我们在今年1月份发了全球第一个全模态端侧模型,它能够同时去感知语音和图像,能够通过语音、图像的感知做决策以后再输出声音和文字,跟人能够看、听、说基本是一样的。我们这个也是端到端的,但这两个端到端只是在你的模型里面是端到端,它不是一个桥接的方式,不代表端到端是把所有工作都做了。

Q:关于聚合智能体,包括智能汽车、飞行汽车,或者eVTOL,以及具身智能,您刚刚讲了很多关于汽车上面的应用,在其他方面会有什么样的考虑?

李大海:我们的愿景就是要打造未来端侧大脑,我们希望它能够部署在每一个终端上。所以我们的端侧大脑现在的目标就是希望对于所有终端都能适用。目前我们已经跟北京一家机器人公司,叫加速进化,在深度合作。他们新出厂的机器人会原装配置面壁智能的面壁小钢炮,并且有不同的级别可以供客户选择,能够去跟用户做自由沟通,甚至还有支持RAG,支持全模态,同时看听说的,这些都有,这个是在机器人上。

我们在手机、PC等等这样的终端上也在跟不同的客户在合作。

Q:AI的技术发展越来越快,竞争也会越来越激烈,跟汽车的融合可能也会越来越多,面壁智能未来怎么样应对这种竞争?更好地跟汽车业有针对性地做一些规划或者目标?

李大海:首先,我们是新近进入汽车领域的一个企业,我们还是非常尊重和敬畏汽车产业过去发展的规律,以及现在已经形成的约定俗成做事情的方式。这些肯定背后有非常多的血和泪才演变成今天这个样子的。我们不觉得我们作为一家AI公司要进来怎么样,我们还是要服务好所有的主机厂,服务肯定是第一位的。

同时,现在在汽车领域的模式就是ToB、ToC,我们通过服务好主机厂,跟其他合作伙伴一起服务好主机厂,让他们最终用户体验到更好的智能座舱的产品体验。

在这个领域里面,我们认为要持续提升自己的竞争力,无外乎是把各个能力竞争能力提升上来。我们目前最大的竞争能力肯定是我们的技术,我们的端侧模型在全球是有引领性的。我们不断发出来的都是全球最早发的模型。我们在2024年提出了“知识密度”的概念,告诉大家大模型知识密度每100天会提升1倍,通过这样一些认知,我们在技术层面还是有非常强的领先优势。接下来我们要把这些技术优势逐步转化为其他的商业优势,同时也能够让整个汽车产业里面更多的主机厂和客户们看到面壁的纵深服务能力,以及把这个技术转化为产品的产品力,把各种维度的能力都拓起来,变成一个六边形战士。这些才能持续在这个领域里面有好的竞争力,这是我个人的理解。

Q:昨天发布的纯端侧的汽车大模型跟之前发布的面壁小钢炮有什么区别?以及在汽车领域有没有具体落地的合作伙伴?

李大海:我们在昨天发的面壁cpmGO,就是面壁小钢炮超级助手,它是基于面壁小钢炮这个端侧模型做出来的一个产品。这个产品除了底层有模型之外,还有更上层很多智能体的技术结合在一起,其实是一个模型+端侧智能体的原生应用。您可以这样简单地理解,它不只是一个裸模型。

面壁从2023年开始就在模型和智能体技术上有很深的积累,我们在2023年7月份曾经发过一个智能体框架,7月份发布,到9月份在全球就有2万个星标,非常网红的一个项目。我们在Agent领域有非常多的积累。我们在当前去做Agent的应用主要还是把我们的模型跟框架结合在一起,去把场景落地落扎实,这是跟模型的区别。

Q:为什么这次选择汽车?之前咱们更多是像荣耀手机终端,是不是也有机会?

李大海:因为端侧智能要在终端落地,汽车、手机都是全球出货量非常大,同时影响力非常大的终端,手机跟汽车都是非常好的场景。相对来说,汽车上更能够突出Agent和模型的价值,因为汽车这个场景用户的手天然就被占了,用户更需要用语音,更需要去感知,去跟座舱交互。同时座舱也有更多传感器能够感知到环境,相对来说手机反而没有这么好的条件,手机关上的时候就不允许它睁开眼睛到处乱看。汽车不一样,汽车这个场景反而是在端侧模型落地时候更好的场景。

手机也有它的优势,手机的优势是在手机上的一些虚拟信息能够更懂用户,这是两个不同的场景,各有各的优势。

Q:现在在谈自动驾驶,手解放了,会不会有一些挑战?

李大海:其实没有关系。自动驾驶,用户的手解放出来以后,我仍然在这样一个场景里面,你习惯使用语音仍然会用语音跟这个车交互。正好当前的技术演进到这一步,超级助手出现了以后,你会更喜欢这种方式。因为我们是全模态,我们用户一举一动都非常清楚,甚至你给它一个眼神它就帮你把事做了,你根本不用做任何手指的操作。这才是我们期待未来想要的助理。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新