自动驾驶，世界模型是唯一解？

汽车公社 2203浏览 2024-12-27 IP属地: 未知

在前一篇文章《开炒VLA，“端到端”过气了？》里，我们了解到一个新的概念“世界模型”。按照目前行业的理解，“端到端”的尽头，就是世界模型。

因为，自动驾驶光有端到端还不够。端到端的“黑盒子”特性，导致上限提高的同时拉低下限，存在“跷跷板效应”。无穷无尽的Corner Case，写不完的代码。就像我那篇文章说的，《“端到端”求L4，无异缘木求鱼》。

那么，如何解决这些问题？世界模型闪亮登场了。

开始喽

粗略统计一下，目前已经大约有超过10个车企和自动驾驶公司提出了世界模型。这里面，包括特斯拉、英伟达、蔚小理华、地绝元魔，以及一些内部在推进此事的企业。

那么，我们要问，什么是世界模型？它是如何生成的？又是如何运行的？

追溯一下，“World Models”（世界模型）最早出现在机器学习领域。

2018年，机器学习顶会NeurIPS收录的《Recurrent World Models Facilitate Policy Evolution》论文，以认知科学中人脑Mental Model来类比世界模型，认为mental model参与了人类的认知、推理、决策过程。其中，最核心的能力——反事实推理（Counterfactual reasoning），是一种人类天然具备的能力。

另外，PLAM掌上电脑创始人杰夫·霍金斯的《千脑智能》中，也介绍了人工智能领域中非常重要的“世界模型”概念。

时间到了2024年2月16日，著名的Open AI公司发布了震惊全世界的“文生视频”大模型Sora，它可以根据文本自动生成一段60秒的视频。这成为世界模型的一个具象体现。

而在人工智能领域，包括李飞飞的World Labs，谷歌DeepMind等企业都发布了世界模型。Yann LeCun的Mate FAIR团队还发布了导航世界模型，根据前一秒的导航信息实时生成下一秒的轨迹。

如今，业内的共识是，一旦这个技术成熟，自动驾驶将迎来真正的爆发。

虽然，国内汽车行业现在还在“卷”从“两段式”的端到端到“一段式”的端到端，但是，按照博世智能驾控中国区总裁吴永桥的说法，从两段式端到端逐步过渡到一段式端到端，最终实现世界模型的应用，这一路线图正逐渐成为业内共识。这是一条车端到云端的路。

而且，梳理一下自动驾驶技术的发展路线，就会发现一个非常有意思的事情。

所谓“功夫在诗外”，这几年所有对自动驾驶发展产生推动的技术都不源于自动驾驶，而是人工智能。这里面，从BEV+Transformer，占用网络OCC，到端到端，世界模型。就像那句话，“自动驾驶本质上是人工智能的一个具身智能体现。”

世界模型仿佛打开了一个全新的窗口和世界，这里面包括探路者特斯拉。

2023年，特斯拉自动驾驶负责人在CVPR上介绍了“通用世界模型”。该模型可以通过过往的视频片段和行动提示，生成“可能的未来”全新视频。

Wayve也在2023 年发布了GAIA-1模型，它可以依靠视频、文本和动作的输入生成逼真的视频，能够生成分钟级的视频以及多种合理的未来场景，帮助自动驾驶模型的训练和仿真。

2024年GTC大会上，英伟达也展示了世界模型领域的新进展：The Next Wave of AI: Physical AI。

而国内车企里面，蔚来比较领先。2023年NIO Day上，蔚来公布其正在自研世界模型。一年后7月27日的科技日上，蔚来智驾负责人任少卿发布中国首个智能驾驶世界模型NWM，释放出更多技术细节。

NWM模型是一个具有全量理解数据、长时序推演和决策能力的智能驾驶世界模型。它能够在100毫秒内推演出216种可能发生的场景，并寻找到最优决策。

11月底，商汤绝影举办了自己的第一个AI DAY，亮出名为“开悟”的世界模型，可生成仿真数据，与量产实车采集的真实数据结合，共同重建物理世界。商汤绝影CTO肖枫还直接说：“‘地大华魔’头部格局，已经是过去式了。”

世界模型有这么厉害？

世界模型怎么做？

小马智行CTO楼天城给了世界模型极高的评价，“世界模型是最重要的事情，没有之一。”

那么，自动驾驶领域，世界模型如何发挥作用？按照地平线的解释，世界模型的作用有两个：

一是通过生成式大模型生成带有预测性质的视频数据，实现Corner Case多样化训练；

二是采用强化学习的方法认识复杂驾驶环境，从视频输出驾驶决策。

而构建世界模型的办法也有两个：一个是凭空想象，“无中生有”；另一个，是根据现有信息完善信息，比如输入文本、图片、视频，生成更多更丰富的视频。

作为自动驾驶的“大杀招”，世界模型解决了两大难题，一个是3D重建的高成本、低效率，另一个就是仿真无法“还原”真实数据的问题。可以说，世界模型包含了仿真的部分内容，但是又完全高于仿真。

这也产生了一个疑问，世界模型是应该凌驾于真实数据之上，还是仅仅作为真实数据的补充？

小马智行CTO楼天城认为，依靠现有的真实数据只能让智驾系统无限接近人，只有世界模型数据才能构建出更复杂的世界，最终让训练出来的系统超越人。换句话说，就是“自动驾驶的安全必须高于人类才有意义”。

所以，必须要有高于人类驾驶行为的世界模型数据训练出来的系统，才能优于人类。按照这个表述，世界模型应该凌驾于真实数据之上。

不过，这样一来，世界模型好坏的评估就很难有个量化的准确办法。只能大致看世界模型的几项能力：准确性，多样性，可控性和泛化能力。

目前的现状，是没有标准解，八仙过海、各显神通。

比如，地平线提出了世界模型的两个长远价值：一是更准确的世界理解，帮助减少智驾系统的代码量、延迟、网络负载、错误率等。二是泛化能力，世界模型可以形成对复杂驾驶环境的通用理解，而非对输入的重复依赖。

按照地平线的实践，其提出的“交互式博弈”，核心在于通过生成数据驱动实现模拟学习和强化学习。为了避免机器对数据的重复模仿，它必须要学会主动理解数据。这时候世界模型就承担了“系统教练”的角色，指导系统到底该怎么开。

而商汤绝影的“开悟”世界模型，基于商汤20 EFLOPS的云端算力，可以做到“（视频生成）时间最长为150秒、分辨率可达1080P、视角可以实现11V”。也即是，通过“实车道路采集+世界模型生成”双轮驱动，实现Corner Case数据生成。

商汤绝影认为这个难度很大，行业普遍都是生成1V或6V视角的视频，开悟直接干到11V，而且同时生成的视角画面越多，要保持时空一致性就更难，还要克服鱼眼视角的畸变。

至于特斯拉和元戎启行的思路，则是用一套系统覆盖两种商业模型，辅助驾驶和Robotaxi。然后用数据训练的方式不断提升系统的能力上限，这种逻辑下世界模型更像是现实世界数据的补充。

按照圆周智行的说法，目前的一个行业共识，是自动驾驶实现的一个大前提不仅仅是像人，而是要超越人。因之，真实世界的数据只能是无限接近人，而要超越人，世界模型是目前通往自动驾驶的唯一解。

那么，用“造数据”的方式来创建一个“美丽新世界”，这个“唯一解”你同意吗？

文章标签：: 新能源

微信

微博 QQ QQ空间

点赞收藏

相关推荐

认定特斯拉FSD宣传存在欺骗性商业行为，法国监管机构要求限时整改

6月25日消息，日前，法国竞争、消费和反欺诈总局（DGCCRF）对特斯拉下令，将特斯拉FSD（完全自动驾驶）的宣传定性为存在“欺骗性商业行为”，要求限期整改。

智行汽车关注

2025-06-26 686浏览 评论
天神之眼B，越来越安全

广州开车有多难？阿卡带你看一看！在各种飞机动车乱飞、神奇老太横过的市区道路上，腾势Z9GT和天神之眼B驾驶辅助凭借着最近一次的OTA升级，能不能保证安全，顺利通过？请看……

阿卡宇航关注

2025-06-26 712浏览 评论
副总亲自下场讲解铂智3X：电池框架比炮弹钢还硬？电池安全冗余超国标2倍？

现在买电车最怕啥？不是续航短，是电池安全没保障！但最近广汽丰田铂智3X可给行业上了一课，广汽丰田副总经理彭宝林亲自在视频里进行了深度技术解读。人家这款车，不仅通过新国标热扩散测试，底部撞击测试直接拿300J能量狂砸3次，这能量可是国标要求的2倍啊！#电车品质看铂智 #合资首家新能......

方向对了关注

2025-06-26 694浏览 评论
腾势D9连获销量冠军，科技豪华颠覆传统豪华

腾势D9又斩获6月前三周新能源MPV销量冠军，腾势D9不仅在国内市场大放异彩，也逐渐在全球热销，像马来西亚、印度尼西亚、泰国等亚太多国，腾势D9都登上了豪华MPV销量冠军，腾势D9正在以科技豪华颠覆传统豪华汽车市场格局。#腾势汽车# #腾势D9# #宜商宜家就选腾势D9#

一直评关注

2025-06-26 484浏览 评论
深蓝车主凡尔赛：被撞反赚2万？修车费比竞品省辆五菱

刚在网上看到一则视频，真的很感慨。一辆比亚迪亲屁股撞深蓝S07，反而把自己的车头撞溃缩了。反观被撞肯定吃亏的深蓝S07，车身结构完整，碰撞后还能照样开，这硬度杠杠滴。关键深蓝车主被撞反赚2万？修车费比竞品省辆五菱！

先锋汽车xfcar 关注

2025-06-26 909浏览 评论
邓超亲测！超好开的华为系SUV岚图FREE+22.99万元开抢

作为岚图品牌“四年磨一剑”的重磅力作，岚图FREE+是岚图FREE在收获10万+车主信任之后的全面升级，新车开发过程中，岚图共计投入了超5亿的研发资金，优化提升了1366项功能，实现了82项同级第一，加配了136项安全防护，实现了产品力从“驾控长板突出”的运动型SUV向“极智驾享......

Big Driver 关注

2025-06-26 472浏览 评论
比亚迪成为公务车首选，每4辆新能源公务车1辆是比亚迪

比亚迪成为公务车首选，每4辆新能源公务车1辆是比亚迪

新锐数码说关注

2025-06-26 923浏览 评论
Momenta智行中国吐鲁番篇上线

#Momenta智行中国# 吐鲁番篇上线丝路古道，驭见新程。在Momenta飞轮大模型支持下的智行中国之旅这次来到了火州吐鲁番，在历史与现代交汇的西域腹地，串联属于这片土地的风情。城市在变，脚步向前，持续关注Momenta，一同探索更多《智行中国》的精彩故事。

科技财经局关注

2025-06-26 946浏览 评论
从ID.4改款看车企巨头的电动化进程：差异化发展是最优解？

从ID.4改款看车企巨头的电动化进程：差异化发展是最优解？

百姓评车关注

2025-06-26 713浏览 评论
激光雷达，打开新“门”

除了乘用车和ROBOTAXI，还有割草机器人。

汽车公社关注

2025-06-26 425浏览 评论
小米 YU7 如何定价才能力挽狂澜？

小米 YU7 被寄予厚望，被视为小米在新能源汽车领域力挽狂澜的关键产品。那么，小米 YU7 究竟该如何做，才能在这个充满挑战的市场中取得成功？

选车网关注

2025-06-26 631浏览 评论
车企唯一！奇瑞入选福布斯中国“可持续发展工业企业”榜单

车企唯一！奇瑞入选福布斯中国“可持续发展工业企业”榜单

车印记关注

2025-06-26 715浏览 评论
无图NOA全国可用！星纪元8155车型猎鹰700辅助驾驶升级新体验

在智能化新能源时代，星途不仅“敢超越”，而且“推平权”。最近，星途星纪元OTA焕新发布会重磅召开，不仅带来了EXEED OS系统的重磅升级，更通过座舱、驾驶、车控等维度的焕新，带着星途星纪元进入全新智能纪元。

睛彩车市关注

2025-06-26 685浏览 评论
哈啰进军Robotaxi，国内无人出租车要来了？

几天前，跳票多年的特斯拉Robotaxi终于出现在美国街头。

智行汽车关注

2025-06-26 662浏览 评论
岚图连续两年护航夏季达沃斯岚图FREE+正式预售

2025天津夏季达沃斯论坛盛大启幕！岚图汽车连续两年成为赞助车辆，岚图FREE+预售22.99万起连续两年！岚图汽车再度护航夏季达沃斯，30万级王炸SUV岚图FREE+重磅预售

智电车讯关注

2025-06-26 649浏览 评论
天山脚下的移动公益站：这辆车如何载着爱穿越2300公里？

天山脚下的移动公益站：这辆车如何载着爱穿越2300公里？

汽车相对论关注

2025-06-26 656浏览 评论
“大众在功劳簿上躺了太久”

奥博穆那只印着“GTI”标志的玻璃水杯，默默见证着大众的背水一战。

汽车公社关注

2025-06-26 508浏览 评论
比亚迪成为公务车首选，公务严选妥妥的！

比亚迪成为公务车首选，公务严选妥妥的！

叶涵趣评关注

2025-06-26 967浏览 评论
大众首款量产全自动驾驶汽车来了，这次玩真的！

大众首款量产全自动驾驶汽车来了，这次玩真的！

极智动力关注

2025-06-26 178浏览 评论
比亚迪第五艘汽车运输船“西安号”交付，打造比亚迪出海新起点

比亚迪第五艘汽车运输船“BYD XI’AN”在江苏仪征顺利交付，这是比亚迪全球化战略布局中的又一里程碑。

极速车坛AUTO 关注

2025-06-26 552浏览 评论
已无数据