2月22日,全球开发者先锋大会上,商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚重磅发布行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,通过构建世界模型生成在线交互的仿真环境,以此进行端到端模型的强化学习训练。按照计划,商汤绝影将于今年4月上海车展发布R-UniAD端到端自动驾驶方案,并完成实车部署。
据了解,商汤绝影的R-UniAD是「多阶段强化学习」端到端自动驾驶技术路线,具体分为三个阶段,首先是依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;然后基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;最后云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。
「算法、算力和数据三者共同推动着人工智能技术的螺旋式上升和进步,随着强化学习等算法引入到大模型训练的思路得到验证,新的尺度定律正在开启,数据价值被进一步深入挖掘,模型能力天花板被打开。」王晓刚表示,强化学习的技术创新也同样可以迁移到端到端自动驾驶领域。基于UniAD端到端自动驾驶方案和「开悟」世界模型,商汤绝影R-UniAD将通过强化学习加速智驾跨越式演进。
强化学习,全新端到端自动驾驶技术路线的关键所在
2022年底,商汤绝影提出了行业首个感知决策一体化自动驾驶通用模型UniAD,并在次年荣获2023年国际计算机视觉与模式识别会议(CVPR)最佳论文,同年8月,特斯拉CEO马斯克直播试驾FSD V12,即端到端自动驾驶技术,越来越多的车企和科技公司开始跟进端到端的技术路线。如今,数据驱动的端到端自动驾驶解决方案已成为行业共识。
端到端的自动驾驶本质是通过海量的高质量人类驾驶数据,来实现最佳的「模仿」驾驶效果。然而,基于模仿学习的技术范式可以做到接近人类但难以突破人类能力上限。同时,受限于高质量场景数据的稀缺性和驾驶数据质量的参差不齐,端到端智驾方案要达到人类驾驶能力的天花板并不容易,动辄千万Clips的高质量数据回流形成了规模门槛。
以模仿学习为主的端到端技术发展面临的挑战
特斯拉通过七百万辆高阶智驾量产车和超10万P算力,已经跨越了这个门槛,同时也构筑了与国内车企具有数量级差距的基础设施壁垒。
这与人工智能的发展历程非常相似。随着互联网上的数据红利被“榨干”,大模型性能的提升只能依靠进一步扩大算力规模和增加模型参数。人工智能技术的发展遇到了瓶颈,一定程度上变成了算力的比拼,一部分人认为,尺度定律(Scaling laws)失效了。
今年春节期间,DeepSeek-R1基于纯强化学习的关键创新引发了广泛的关注。通过少量高质量数据的冷启动,模型进行多阶段的强化学习训练,有效降低大模型训练的数据规模门槛,同时也让尺度定律得以延续,为模型变得更大更强铺平了道路。更重要的是,强化学习能够让大模型自行涌现出长思维链能力,显著提升推理效果,甚至可能具备超越人类的思维能力。
王晓刚表示,基于强化学习的大模型技术路线可以迁移到端到端自动驾驶算法的训练与研发之中。
基于强化学习,商汤绝影提出「与世界模型协同交互的端到端技术路线」
从数据规模来看,多阶段强化学习的训练方法能大幅降低端到端自动驾驶数据规模门槛。R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。据测算,小样本多阶段学习的技术路线能让端到端自动驾驶的数据需求降低一个数量级,让车企合作伙伴有望换道超车特斯拉FSD。
从性能上限来看,纯强化学习训练让端到端智驾模型有望通过在提升性能的同时,充分探索多元场景和驾驶风格。未来,端到端智驾体验的上限不再是「类人」,而是可以拥有超越人类的驾驶表现。
商汤绝影发布「与世界模型协同交互的端到端自动驾驶技术路线R-UniAD」
作为最专注汽车行业的AI公司,商汤绝影一直在探索和落地以AI的方式解决智驾问题,也持续着引领端到端自动驾驶的创新潮流。
在UniAD荣获CVPR最佳论文之后,2024年北京车展,商汤绝影展示了UniAD的实车上路成果,量产端到端智驾方案则预计会在今年年底交付落地。2月22日,商汤绝影率先发布「与世界模型协同交互的端到端自动驾驶技术路线R-UniAD」,成为行业首个将基于世界模型的强化学习引入端到端智驾的研发与训练的AI公司。
商汤绝影的R-UniAD是「多阶段强化学习」端到端自动驾驶技术路线,具体分为三个阶段,首先是依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;然后基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;最后云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。
商汤绝影R-UniAD:「多阶段强化学习」端到端自动驾驶技术路线
因为端到端智驾模型是一个多模态具身模型,最关键的是要与依靠世界模型生成的仿真环境进行在线交互,并获得闭环奖励反馈,从而实现强化学习,使得端到端模型的训练能够充分探索各种可能性。也就是说,能够生成高保真的场景数据、保证长时推演一致性、并支持在线交互的强大世界模型是R-UniAD的核心基石。
早在2024年11月「绝影实力AI DAY」上,王晓刚就表示:「智驾高端局的竞争不止是车端模型的比拼,端到端的决战,战场在云端。」为此,商汤绝影全新升级并发布行业标杆级别的世界模型——「开悟」世界模型。世界模型最基础也是最核心的能力是生成高质量视频数据,基于「开悟」,1个GPU产生的仿真数据相当于500台量产车的数据采集效果。
以绝影量产智驾方案和「开悟」世界模型为核心,实车采集的真实数据和云端生成的仿真数据在「车云一体」的新范式下进行闭环流转,使得端到端智驾系统的训练更加全面、高效,大幅缩短了研发周期,降低了成本。
如今,「开悟」世界模型的能力进一步提升,将支持实现端到端算法与世界模型仿真环境实时交互。
在现场演示中,商汤绝影展示了「开悟」世界模型与主车闭环交互的方式。通过场景库文件导入一个BEV视角下的初始主车和他车位置,世界模型自动生成主车视角下11V(11个摄像头)的传感器仿真数据,端到端模型接收到这一数据后,生成自车下一时刻位置并进行反馈,世界模型根据刷新的主车位置和预测的他车位置渲染新的11V传感器仿真数据。
商汤绝影现场演示端到端算法与世界模型仿真环境实时交互
商汤绝影的量产端到端智驾方案预计将在年底交付,「开悟」世界模型也正式用于数据生产,已经抢占新技术路线的先机。而在4月的上海车展,商汤绝影将会展示「与世界模型协同交互的端到端自动驾驶方案」的实车部署。
依托商汤大装置算力基础设施,商汤绝影能够建立强大的云端自动驾驶大模型,蒸馏得到可以部署在更小算力芯片的端到端模型,助力车企合作伙伴,基于更小数量级的数据,超越特斯拉依靠百万台量产车数据回流的自动驾驶方案,更是超越人类的驾驶水平,加速智能汽车驶入AGI全新未来。
特斯拉全电动皮卡Cybertruck获美国NHTSA五星安全评级,成第二款获此荣誉的电动皮卡。其在多数测试中表现出色,仅在翻车抗性和乘客正面碰撞测试中获四星评级。如正面碰撞测试中,挡风玻璃保持完整,车门正常开启,前排气囊正常展开。侧面碰撞测试结果稳定。尽管安全表现获认可,但其售价......
雷克萨斯国产,这是多年以来我们大家翘首以盼的事,这次国产雷克萨斯是真的来了。为什么突然国产?我们一起来揭秘一下。
东风长安整合在即,邓留超履新系为东风风神收尾?
这个车企,今年比比亚迪还卷?
亚迪全民智驾后,最便宜的华为车,将再次为友商带来寒意。
驭鉴天工 启新长红 红旗天工08区域上市合肥站荣耀启幕
“混动王者 国民标杆”奇瑞风云T8正式上市,限时抢鲜价9.99万元起
比亚迪旗下豹 5 智驾版上市,为智能硬派越野注入新动力
【强强联合】 一汽奔腾与地平线正式达成战略合作 共筑智能驾驶新生态
东风长安整合在即,邓留超履新系为东风风神收尾?
引领国民SUV新风尚奇瑞风云T8全球上市售价10.39万元起
2025年2月22日,“100台豪沃 MAX 危化品牵引车战略签约暨首批30台交车仪式”于淄博隆重举行!中国重汽携手淄博大客户,以安全为基、以品质为擎,共同开启危化品运输领域合作新纪元,为行业高质量发展注入强劲动能!
【强强联合】 一汽奔腾与地平线正式达成战略合作 共筑智能驾驶新生态
2025年2月21日,中国长春,中国一汽旗下主流乘用车品牌一汽奔腾与行业领先的智驾科技企业地平线正式签署智能驾驶领域战略合作协议。
豹 5 智驾版正式上市,多项顶尖科技助力硬派越野升级
比亚迪智驾革命:智驾前辈们慌不慌?
夏花繁花新车大幅降价,背刺老车主谁的错?谐音导致起名不当,应不应该改?2025年莲花起步为何就出师不利?
豹 5 智驾版正式上市,多项顶尖科技助力硬派越野升级
技术亮了,江淮跌了,比亚迪涨了
我们总把汽车称为“大玩具”,但实际购买时,考虑的更多的却是家用需求,而它所能带来的娱乐以及情绪价值往往总要退后一步。直到iCAR这个品牌的出现,它似乎很好的平衡了硬需求与精神需要的矛盾。