商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚
随着算法的进化,端到端自动驾驶技术路线正朝着更高效、智能和自适应的方向发展。
2月22日,2025GDC全球开发者先锋大会期间,商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚发布了“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,即通过构建世界模型生成在线交互的仿真环境,以此进行端到端模型的强化学习训练。
据王晓刚介绍,R-UniAD与DeepSeek技术创新思路同归一源:从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。
简言之,DeepSeek技术是一个基于深度学习的图像搜索和识别技术,其主要应用于图像识别、目标检测等任务。在智能驾驶领域,它可以为智能驾驶系统提供一些重要的借鉴和参考意义。
比如在实时物体检测和识别方面,DeepSeek 技术可以通过深度学习模型对图像进行处理,实时识别道路上的物体,如行人、车辆、交通标志等,够帮助自动驾驶系统实时感知周围环境,从而做出相应的决策。
由于自动驾驶涉及到大量的环境感知与决策场景,依赖于大量的标注数据进行训练,因此模拟环境中的数据生成和增强变得至关重要。R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。
这种“多阶段强化学习”端到端自动驾驶技术路线,具体可分为三个阶段:
1、依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;
2、基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;
3、云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。
通过这项技术,智能驾驶系统可以不断从海量的驾驶数据中学习和优化自己的模型,通过“仿真+现实”的训练方式加速自动驾驶系统的学习过程,来更好地应对复杂的道路场景。
早在2022年底,商汤绝影提出了行业首个感知决策一体化自动驾驶通用模型UniAD,2024年北京车展期间,商汤绝影还展示了UniAD的实车上路成果,商汤绝影一直在不遗余力地推动这项技术的商业化进程。
据钛媒体App得知,商汤绝影的量产端到端智驾方案预计将在年底交付,“开悟”世界模型也正式用于数据生产,而在今年4月的上海车展,商汤绝影将会展示“与世界模型协同交互的端到端自动驾驶方案”的实车部署。
(本文首发于钛媒体App)