理想汽车发布下一代自动驾驶架构MindVLA

车印记 971浏览 2025-03-18 IP属地: 未知

2025年3月18日，理想汽车自动驾驶技术研发负责人贾鹏在NVIDIA GTC 2025发表主题演讲《VLA：迈向自动驾驶物理智能体的关键一步》，分享了理想汽车对于下一代自动驾驶技术MindVLA的最新思考和进展。

贾鹏表示：“MindVLA是机器人大模型，它成功整合了空间智能、语言智能和行为智能，一旦跑通物理世界和数字世界结合的范式后，将有望赋能更多行业。MindVLA将把汽车从单纯的运输工具转变为贴心的专职司机，它能听得懂、看得见、找得到。我们希望MindVLA能为汽车赋予类似人类的认知和适应能力，将其转变为能够思考的智能体。”

理想全栈自研MindVLA：深度融合空间、语言及行为智能

基于端到端+VLM双系统架构的最佳实践，及对前沿技术的敏锐洞察，理想自研VLA模型——MindVLA。VLA是机器人大模型的新范式，其将赋予自动驾驶强大的3D空间理解能力、逻辑推理能力和行为生成能力，让自动驾驶能够感知、思考和适应环境。

理想汽车发布下一代自动驾驶架构MindVLA

MindVLA不是简单地将端到端模型和VLM模型结合在一起，所有模块都是全新设计。3D空间编码器通过语言模型，和逻辑推理结合在一起后，给出合理的驾驶决策，并输出一组Action Token（动作词元），Action Token指的是对周围环境和自车驾驶行为的编码，并通过Diffusion（扩散模型）进一步优化出最佳的驾驶轨迹，整个推理过程都要发生在车端，并且要做到实时运行。

MindVLA六大关键技术，树立全新技术范式

MindVLA打破自动驾驶技术框架设计的传统模式，使用能够承载丰富语义，且具备出色多粒度、多尺度3D几何表达能力的3D高斯（3D Gaussian）这一优良的中间表征，充分利用海量数据进行自监督训练，极大提升了下游任务性能。

理想汽车发布下一代自动驾驶架构MindVLA

理想从0开始设计和训练了适合MindVLA的LLM基座模型，采用MoE混合专家架构，引入Sparse Attention（稀疏注意力），实现模型稀疏化，保证模型规模增长的同时，不降低端侧的推理效率。基座模型训练过程中，理想加入大量3D数据，使模型具备3D空间理解和推理能力。为了进一步激发模型的空间智能，理想加入了未来帧的预测生成和稠密深度的预测等训练任务。

LLM基座模型获得3D空间智能的同时，还需要进一步提升逻辑推理能力。理想训练LLM基座模型学习人类的思考过程，让快慢思考有机结合到同一模型中，并可以实现自主切换快思考和慢思考。为了把NVIDIA Drive AGX的性能发挥到极致，MindVLA采取小词表结合投机推理，以及创新性地应用并行解码技术，进一步提升了实时推理的速度。至此，MindVLA实现了模型参数规模与实时推理性能之间的平衡。

MindVLA利用Diffusion将Action Token解码成优化的轨迹，并通过自车行为生成和他车轨迹预测的联合建模，提升在复杂交通环境中的博弈能力。同时Diffusion可以根据外部条件，例如风格指令，动态调整生成结果。为了解决Diffusion模型效率低的问题，MindVLA采用Ordinary Differential Equation（常微分方程）采样器，实现了2-3步就能完成高质量轨迹的生成。面对部分长尾场景，理想建立起人类偏好数据集，并且创新性地应用RLHF（基于人类反馈的强化学习）微调模型的采样过程，最终使MindVLA能够学习和对齐人类驾驶行为，显著提升安全下限。

理想汽车发布下一代自动驾驶架构MindVLA

MindVLA基于自研的重建+生成云端统一世界模型，深度融合重建模型的三维场景还原能力与生成模型的新视角补全，以及未见视角预测能力，构建接近真实世界的仿真环境。源于世界模型的技术积累与充足计算资源的支撑，MindVLA实现了基于仿真环境的大规模闭环强化学习，即真正意义上的从“错误中学习”。过去一年，理想自动驾驶团队完成了世界模型大量的工程优化，显著提升了场景重建与生成的质量和效率，其中一项工作是将3D GS的训练速度提升至7倍以上。

理想汽车发布下一代自动驾驶架构MindVLA

理想通过创新性的预训练和后训练方法，让MindVLA实现了卓越的泛化能力和涌现特性，其不仅在驾驶场景下表现优异，在室内环境也展示出了一定的适应性和延展性。

MindVLA赋能汽车变为专职司机，重塑用户体验

MindVLA将为用户带来全新的产品形态和产品体验，有MindVLA赋能的汽车是听得懂、看得见、找得到的专职司机。“听得懂”是用户可以通过语音指令改变车辆的路线和行为，例如用户在陌生园区寻找超市，只需要通过理想同学对车辆说：“带我去找超市”，车辆将在没有导航信息的情况下，自主漫游找到目的地；车辆行驶过程中，用户还可以跟理想同学说：“开太快了”“应该走左边这条路”等，MindVLA能够理解并执行这些指令。

理想汽车发布下一代自动驾驶架构MindVLA

“看得见”是指MindVLA具备强大的通识能力，不仅能够认识星巴克、肯德基等不同的商店招牌，当用户在陌生地点找不到车辆时，可以拍一张附近环境的照片发送给车辆，拥有MindVLA赋能的车辆能够搜寻照片中的位置，并自动找到用户。

“找得到”意味着车辆可以自主地在地库、园区和公共道路上漫游，其中典型应用场景是用户在商场地库找不到车位时，可以跟车辆说：“去找个车位停好”，车辆就会利用强大的空间推理能力自主寻找车位，即便遇到死胡同，车辆也会自如地倒车，重新寻找合适的车位停下，整个过程不依赖地图或导航信息，完全依赖MindVLA的空间理解和逻辑推理能力。

总结来说，对于用户而言，有MindVLA赋能的车不再只是一个驾驶工具，而是一个能与用户沟通、理解用户意图的智能体；对于汽车行业而言，像iPhone 4重新定义了手机，MindVLA也将重新定义自动驾驶；对于人工智能领域而言，汽车作为物理人工智能的最佳载体，未来探索出物理世界和数字世界结合的范式，将有望赋能多个行业协同发展。

理想在不断进行技术创新的同时，还在人工智能领域顶级学术会议和期刊发表了大量论文，为加速技术发展贡献了重要力量。未来，理想汽车将继续在用户价值的驱动下，坚持技术创新，连接物理世界和数字世界，成为全球领先的人工智能企业。

理想汽车发布下一代自动驾驶架构MindVLA

文章标签：: 新能源

微信

微博 QQ QQ空间

点赞收藏

相关推荐

小鹏嗷嗷乱杀，电车难卖高价

“我们距离KTV还远呢，此刻还在ICU的门口。”

汽车公社关注

2025-03-18 924浏览 评论
特斯拉中国版FSD首个迭代曝光，能否在中国市场逆风翻盘？

特斯拉中国版FSD首个迭代曝光，能否在中国市场逆风翻盘？

买车家关注

2025-03-18 928浏览 评论
比亚迪发布超级e平台，以兆瓦闪充开启「油电同速」时代

比亚迪超级e平台，兆瓦闪充开启油电同速

响铃说关注

2025-03-18 727浏览 评论
油车用户集体破防：比亚迪闪充5分钟续航400公里，加油枪将报废？

2025年3月17日，比亚迪召开超级e平台技术发布暨汉L、唐L预售发布会，发布划时代超级e平台，推出闪充电池、3万转电机和全新一代车规级碳化硅功率芯片，核心三电全维升级，刷新多项全球之最。在充电速度上，实现充电功率1兆瓦（1000kW），实现全球量产最高峰值充电速度1秒2公里，达......

极客力量关注

2025-03-18 504浏览 评论
充电5分钟补能400公里？！比亚迪发布兆瓦级充电系统

比亚迪：实力开启电动化新时代

汽车梦想秀关注

2025-03-18 0浏览 评论
智己成为阿里系AI落地汽车首选，IM AIOS生态座舱重磅发布

2025年3月17日，智己汽车携手阿里巴巴旗下斑马智行、饿了么等板块行业首发“IM AIOS生态座舱”，并将于4月正式进入落地阶段。该座舱深度融合阿里前沿AI技术及生态资源，首次将阿里生态服务以AI Agent形式落地，开创“No Touch & No App”的人车交互模式。I......

车务网汽车关注

2025-03-18 150浏览 评论
油电同速、汉唐预售：3分钟看完比亚迪的技术狂欢盛宴

核心三电全面进化，重新定义电动出行，推进发展新方向

丹东晓程关注

2025-03-18 369浏览 评论
五菱红标增程技术重磅亮相：以高效领先技术赋能用户创富新未来

今日（3月18日），五菱红标新能源领域迎来全新突破，正式推出高效领先的中国新能源商用车增程技术。

车界艺术家关注

2025-03-18 452浏览 评论
预料之中的结果来了：蔚来汽车和宁德时代达成换电业务战略合作

预料之中的结果来了：蔚来汽车和宁德时代达成换电业务战略合作

天和Auto 关注

2025-03-18 283浏览 评论
真大湾区生活！从中山到台山吃黄鳝饭

我听同事说，上次在台山BC调校避震的时候，无意中发掘到一家附近的黄鳝饭餐厅，味道和环境都很特别。据说这家店还有很多故事和争议，在餐品之外满足我的好奇心。所以这次，我们的晚餐选择从中山出发，直达台山吃黄鳝饭，得益于大湾区高速公路网的发达，我们仅花费在广州高峰期堵车的时间，就轻松抵达......

一辆Acartv 关注

2025-03-18 532浏览 评论
五菱红标增程技术重磅亮相：以高效领先技术赋能用户创富新未来

五菱红标增程技术重磅亮相：以高效领先技术赋能用户创富新未来

汽车新语关注

2025-03-18 358浏览 评论
比亚迪这波什么黑科技？！1秒钟能充2公里？！

我滴乖乖，比亚迪这波什么黑科技？！1秒钟能充2公里？！这充电速度，简直起飞啊，简直是纯电时代技术新标杆。以后充电5分钟，直接能从北京到济南，这跟燃油车加油有啥区别？简直一模一样啊。之前那些电动车充电半天才跑那么点路程，现在比亚迪直接翻倍，吊打全场。

涵冰科技关注

2025-03-18 0浏览 评论
#比亚迪汉L兆瓦闪充1秒2公里# 1秒充2公里引领电动车新标准

#比亚迪汉L兆瓦闪充1秒2公里# 1秒充2公里引领电动车新标准

车小婉wan 关注

2025-03-18 617浏览 评论
当技术跟不上时代，外资巨头也怕“卡脖子”

技术红利与地缘博弈，奔驰、大众、雷诺选择用脚投票。

汽车公社关注

2025-03-18 996浏览 评论
比亚迪闪充1秒充2公里，还买什么油车？

最强比亚迪闪充技术来了，1秒充2公里，买油车和买换电的都别着急，都可以等等。

AUTO芯球关注

2025-03-18 320浏览 评论
今年买车合适吗？

今年买车合适吗？

驱动生活栏目关注

2025-03-18 799浏览 评论
比亚迪超级e平台，兆瓦闪充开启油电同速

2025年3月17日，比亚迪召开超级e平台技术发布暨汉L、唐L预售发布会，发布划时代超级e平台，推出闪充电池、3万转电机和全新一代车规级碳化硅功率芯片，核心三电全维升级，刷新多项全球之最。在充电速度上，实现充电功率1兆瓦（1000kW），实现全球量产最高峰值充电速度1秒2公里，达......

车务网汽车关注

2025-03-18 257浏览 评论
智己发布IM AIOS座舱会“听话”的汽车大脑

3月17日，智己汽车和阿里斑马智行携手，行业首发了IM AIOS生态座舱，将于4月正式落地。

车视玩家关注

2025-03-18 1178浏览 评论
比亚迪发布超级e平台，以兆瓦闪充开启「油电同速」时代

实力开启电动化新时代

汽车梦想秀关注

2025-03-18 683浏览 评论
前者铺路，后者超越，王传福说中国汽车用技术接棒向前

从国产游戏黑神话:悟空震惊老外，到全民托举哪吒IP文化出圈，从DeepSeek惊艳世界，到大疆无人机称霸世界，以及现如今全世界都爱上了中国车，比亚迪也一跃成为了纯电时代技术新标杆。

极客力量关注

2025-03-18 614浏览 评论
已无数据