在NVIDIA GTC 2025大会上,卓驭AI的首席执行官陈晓智带来了一场别开生面的演讲,主题聚焦于智能驾驶技术的最新进展——《基于端到端世界模型的生成式智驾体验》。在此次演讲中,卓驭不仅展示了其在智能驾驶领域的最新研究成果,还正式推出了一个划时代的产品:可支持自然语言交互的个性化生成式智能驾驶方案——GenDrive。
卓驭认为,高阶智能驾驶不仅要追求拟人化的驾驶体验,更要深度满足用户的个性化需求。正是基于这样的理念,卓驭首次在行业内提出了“生成式智驾”的概念,并通过GenDrive方案将其变为现实。相较于传统的智能驾驶体验,生成式智驾不仅能够提供高度拟人化的驾驶感受,更能根据用户的个人偏好进行灵活调整。
传统端到端智能驾驶架构往往基于预测范式,即根据传感器输入预测下一步动作,这一过程相对固定且缺乏灵活性。而卓驭的GenDrive则采用了生成式技术,通过构建世界模型来预测未来可能发生的多种场景,并结合用户偏好和环境信息,从中选择最优的驾驶轨迹。
卓驭的端到端世界模型架构层次分明,底层由硬件平台支撑,包括适用于英伟达计算平台的智驾控制器,如DRIVE Orin和Thor SoC,同时能够适配多种类型的传感器配置。在模型输入层面,卓驭通过Vision Encoder和Tokenizers对传感器数据、导航信息以及历史轨迹进行编码,同时还将驾驶风格和语音指令融入模型之中。
模型的输出则涵盖了周围环境的语义和几何理解,以及对未来多种可能性的预测。最终的驾驶轨迹,是在综合用户风格偏好、语音指令以及环境信息后得出的最优结果。
卓驭在训练端到端世界模型时,采用了大模型典型的预训练与后训练相结合的方式,并实现了“硬件无关”的平台化训练。这意味着,针对不同传感器配置和芯片类型,只需训练一个模型,即可轻松部署到不同硬件上。
基于这一先进的架构,卓驭的生成式智能驾驶方案GenDrive具备了一系列令人瞩目的功能。例如,用户可以根据自己的喜好自定义场景级别的驾驶风格,包括跟车风格、速度控制、路口转弯和变道方式等。GenDrive还能在线学习和模仿用户的驾驶风格,只需利用车端算力,无需云端交互,即可自动学习用户的驾驶偏好。结合座舱内的人脸识别技术,GenDrive还能自动绑定不同的用户ID,激活相应的驾驶风格。
更令人惊叹的是,GenDrive支持自然语言交互,用户可以通过语音指令来控制驾驶风格和具体动作。无论是请求更柔和或更激进的驾驶风格,还是指示车辆进入特定车道、辅路或停在指定位置,GenDrive都能准确理解用户意图,并实时调整驾驶轨迹。
据卓驭官方透露,这一革命性的生成式智能驾驶体验将在今年内搭载于相关车型上,实现量产落地。这一消息无疑为智能驾驶技术的发展注入了新的活力,也让人们对未来智能驾驶的个性化体验充满了期待。