理想汽车VLA司机大模型在成长中持续解决行业问题

Y车评 3023浏览 2025-05-08 IP属地: 未知

2025年5月7日，理想汽车推出“理想AI Talk第二季——理想VLA司机大模型，从动物进化到人类”，理想汽车董事长兼CEO李想重点分享了对于人工智能的最新思考，VLA司机大模型的作用、训练方法和挑战，以及对于创业和个人成长的见解。

李想将AI工具分为三个层级，分别是信息工具、辅助工具和生产工具。目前，大多数人将AI作为信息工具使用，但信息工具常伴随大量无效信息、无效结果和无效结论，仅具参考价值。成为辅助工具后，AI可以提升效率，例如现在的辅助驾驶，但仍需人类参与。未来，AI发展为生产工具后，将能独立完成专业任务，显著提升效率与质量。

李想表示：“判断Agent（智能体）是否真正智能，关键在于它是否成为生产工具。只有当人工智能变成生产工具，才是其真正爆发的时刻。就像人类会雇佣司机，人工智能技术最终也会承担类似职责，成为真正的生产工具。”

VLA的实现不是突变的过程，是进化的过程

目前的L2、L2+组合驾驶辅助仍属于辅助工具阶段，而VLA（Vision-Language-Action Model，视觉语言行动模型）能够让AI真正成为司机，成为交通领域的专业生产工具。对理想汽车而言，未来的VLA就是一个像人类司机一样工作的司机大模型”。

VLA的实现不是一个突变的过程，是进化的过程，经历了三个阶段，对应理想汽车辅助驾驶的昨天、今天和明天。第一阶段，理想汽车自2021年起自研依赖规则算法和高精地图的辅助驾驶，类似“昆虫动物智能”。第二阶段，理想汽车自2023年起研究，并于2024年正式推送的端到端+VLM（Vision Language Model，视觉语言模型）辅助驾驶，接近“哺乳动物智能”。

端到端模型在处理复杂问题时存在局限，虽可借助VLM视觉语言模型辅助，但VLM使用开源模型，使其在交通领域的能力有限。同时端到端模型也难以与人类沟通。为了解决这些问题并提升用户的智能体验，理想汽车自2024年起开展VLA研究，并在多项顶级学术会议上发表论文，夯实了理论基础。

在端到端的基础上，到第三阶段，VLA将开启“人类智能”的阶段。它能通过3D和2D视觉的组合，完整地看到物理世界，而不像VLM仅能解析2D图像。同时，VLA拥有完整的脑系统，具备语言、CoT（Chain of Thought，思维链）推理能力，既能看，也能理解并真正执行行动，符合人类的运作方式。

VLA训练过程模拟人类学习，对齐人类价值观

VLA的训练分为预训练、后训练和强化训练三个环节，类似于人类学习驾驶技能的过程。预训练相当于人类学习物理世界和交通领域的常识，通过大量高清2D和3D Vision（视觉）数据、交通相关的Language（语言）语料，以及与物理世界相关的VL（Vision-Language，视觉和语言）联合数据，训练出云端的VL基座模型，并通过蒸馏转化为在车端高效运行的端侧模型。

后训练相当于人类去驾校学习开车的过程。随着Action（动作）数据的加入——即对周围环境和自车驾驶行为的编码，VL基座变为VLA司机大模型。得益于短链条的CoT，以及Diffusion扩散模型对于他车轨迹和环境的预测，VLA具备实时性的特点，实现了在复杂交通环境中的博弈能力。

强化训练类似于人类在社会中实际开车练习，目标是让VLA司机大模型更加安全、舒适，对齐人类价值观，甚至超越人类驾驶水平。强化训练包含两部分：一是通过RLHF（Reinforcement Learning from Human Feedback，基于人类反馈的强化学习）完成安全对齐，使模型遵守交通规则，贴合中国用户的驾驶习惯；二是将纯强化学习模型放入世界模型中训练，提升舒适性，避免碰撞事故，遵守交通规则。经过预训练、后训练和强化训练后，VLA司机大模型即可部署至车端运行。

VLA司机大模型以“司机Agent（智能体）”的产品形态呈现，用户可通过自然语言与司机Agent沟通，跟人类司机怎么说，就跟司机Agent怎么说。简单通用的短指令由端侧的VLA直接处理，复杂指令则先由云端的VL基座模型解析，再交由VLA处理。

超级对齐确保AI决策安全，世界模型破解AI黑盒难题

除了提升专业能力，VLA司机大模型还需解决安全性和模型黑盒的问题。

模型能力越强，越需要职业性约束，以确保能力下限。为了保障VLA司机大模型能够实现职业司机般的安全和舒适，避免学习加塞等违规行为，理想汽车在强化训练环节投入大量资源，并于2024年底组建超过100人的超级对齐团队，相当于为司机Agent注入职业素养。

为解决模型的黑盒问题，理想汽车结合重建和生成两种路径，打造了真实、符合物理世界规律的世界模型，覆盖所有交通参与者和要素。基于世界模型的仿真能力，VLA可以在世界模型中低成本、准确地验证现实问题，提升解决问题的效率，有效应对模型黑盒带来的挑战。

判断司机Agent是否是个好司机，有三个关键标准：专业能力、职业能力和构建信任的能力。VLA司机大模型提升了专业能力，超级对齐增强了职业能力，VLA通过理解自然语言、具备记忆能力提升了构建信任的能力。

人工智能时代，扎实的基本功比走捷径重要

理想汽车实现技术快速跃迁的背后，是从研究、研发到能力表达，再到将能力变成业务价值的基本功积累。研究是关键，研究突破后，研发的效率会大幅提升，且注重价值转化，最终实现业务落地。

理想汽车坚持自研，通过技术赋能用户价值。例如，在辅助驾驶方面，由于英伟达Orin-X芯片无法直接运行语言模型，端到端+VLM的辅助驾驶方案对部分企业来说仍具挑战。理想汽车依托自有编译团队，自研底层推理引擎，使芯片可通过INT4（4比特整型）量化的方式运行VLM。同时，凭借芯片、控制器设计和自研汽车操作系统等综合能力，理想汽车实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。李想表示，大型企业的基本功和能力永远无法被逾越。

得益于DeepSeek的开源，理想汽车在VLA司机大模型的语言能力研发上提速显著，节省了近9个月的时间和数亿元成本。尽管如此，理想汽车仍选择加大投入，在基座模型上投入超预期3倍的训练卡，专注打造适配多场景的自研模型。李想表示：“我们可以站在巨人的肩膀上，但它只是其中的一部分。”在受益开源的同时，理想汽车也选择开源自研的汽车操作系统——理想星环OS，回馈社会。

今年7月，理想汽车将迎来成立十周年。从使用增程电动和5C超充技术解决电池成本高、充电难、充电慢的问题，到自研汽车操作系统攻克传统汽车操作系统性能差、开发缓慢、芯片匹配周期长等挑战，理想汽车始终以技术创新解决行业无法解决的问题。自研VLA时，理想汽车更是踏入了人工智能的无人区。当前，辅助驾驶走到了新的十字路口上，理想汽车将不断挑战成长的极限，持续为行业和用户创造价值。

文章标签：: 行业分析

微信

微博 QQ QQ空间

点赞收藏

相关推荐

百年长安启新程：以创新驱动迈向世界一流汽车集团

百年长安启新程：以创新驱动迈向世界一流汽车集团

汽车洋葱圈关注

2025-08-04 1190浏览 评论
势不可挡北京现代7月销量同比增长41.5%

势不可挡北京现代7月销量同比增长41.5%

首都车市关注

2025-08-04 711浏览 评论
2025上半年比亚迪领跑全球多个新能源汽车市场

2025上半年比亚迪领跑全球多个新能源汽车市场

车动力大嘴说车关注

2025-08-04 189浏览 评论
单月销量“七连涨”，上汽为何如此坚挺

上汽7月销量发布

汽车网评关注

2025-08-04 540浏览 评论
博世高管呼吁高阶智驾收费，企业生存与用户体验的博弈

博世高管呼吁高阶智驾收费，企业生存与用户体验的博弈

汽车点评车叔关注

2025-08-04 732浏览 评论
下半年港股投资，创新药、人工智能、新消费“三箭齐发”

上半年港股受基本面及资金面共同推动领涨全球，原因在于业绩增长、南向资金流入和政策利好驱动。恒生指数上半年涨幅20%，恒生科技指数上半年涨幅19%，从背后原因来看，港股今年上涨主要来源于业绩增长，基本面改善为其核心支撑。分板块来看，医药、科技AI、汽车消费和红利高股息领涨。&nbs......

证券市场周刊关注

2025-08-04 308浏览 评论
新央企成立！百年长安再启征程，三大数智新能源品牌全新发展

新央企新长安成立

出行局关注

2025-08-04 99浏览 评论
单月销量“七连涨”，上汽为何如此坚挺

上汽7月销量发布

汽车网评关注

2025-08-04 585浏览 评论
2025上半年比亚迪领跑全球多个新能源汽车市场

2025上半年比亚迪领跑全球多个新能源汽车市场

数码的生活关注

2025-08-04 0浏览 评论
东风奕派科技亮剑"未来之翼"，央企造车新势力的三大破局密码‌‌

东风奕派科技亮剑未来之翼，央企造车新势力的三大破局密码‌‌

波帆说车关注

2025-08-04 0浏览 评论
目标年销500万辆！独立后的长安汽车，凭啥这么狂？

长安汽车独立为国务院国资委直接管理的一级央企。

xuser19468529 关注

2025-08-04 52浏览 评论
智己“恒星”超级增程，让电车自带超充桩

一场关于续航焦虑的革命正在上演。中国汽车工程研究院最新数据显示，北方冬季新能源汽车平均续航衰减率仍达30%，而充电基础设施在三线以下城市的覆盖率不足40%。在这场技术突围战中，智己汽车以恒星超级增程技术强势入局，用66kWh 800V电池包、1500公里超长续航和-30℃严寒续航......

引擎密码关注

2025-08-04 953浏览 评论
“撞赢”卡车后，理想汽车再次回应，态度变了

“撞赢”卡车后，理想汽车再次回应，态度变

电驱蓝波ONE 关注

2025-08-04 270浏览 评论
年内机构调研分化，周大生、潮宏基等消费公司回暖，“被调研之王”花落这家创业板公司

从年内的调研情况看，食品饮料的恢复尚需时日，汇川技术意外“问鼎”。

证券市场周刊关注

2025-08-04 330浏览 评论
北京现代7月势如破竹！销量17761辆同比劲增41.5%

近日，在公认的汽车市场销售淡季，北京现代却再传捷报。据北京现代发布的最新数据显示，继6月份实现逆势增长后，7月份累计销售达到17761辆，同比增长41.5%。销量持续向好，进一步表明北京现代的“品质功底”在竞争中，正在被更多用户接受、认可和信赖。

AM车镜关注

2025-08-04 1005浏览 评论
神州租车将从宁德时代引入10万辆换电汽车，行业或将迎来重大转折

神州租车将引进10万辆宁德时代换电车型，电动车产业发展方向要变

天和Auto 关注

2025-08-04 710浏览 评论
合资纯电销冠发起“车圈冰桶挑战”！铂智3X带你解锁停车自由

铂智3X发起了一场车圈冰桶挑战——要在全国挑战200个魔鬼停车位！

AM车镜关注

2025-08-04 1293浏览 评论
蔚来7月交付21017辆汽车，同比增长25.2%

2025年7月，蔚来公司交付新车21,017台，前七个月同比增长25.2%。

IT三剑客关注

2025-08-04 301浏览 评论
奇瑞集团7月销售汽车22.44万辆，同比增长14.7%

奇瑞集团7月销售汽车22.44万辆，同比增长14.7%

新车部落关注

2025-08-04 0浏览 评论
永泰能源迎峰度夏创佳绩筑牢电力保供新屏障

在炎炎夏日，电力供应成为保障社会正常运转的关键。永泰能源（600157.SH）所属电厂在迎峰度夏时期以卓越的表现和担当，交出了一份令人瞩目的答卷。7月份，永泰能源旗下火电厂发电量创历史新高，全月完成发电量47.03亿千瓦时，为区域经济社会的稳定运行筑牢了电力保供屏障。

证券市场周刊关注

2025-08-04 1097浏览 评论
已无数据