当前位置 爱咖号首页 理想汽车VLA司机大模型,在成长中解决问题

理想汽车VLA司机大模型,在成长中解决问题

主播说车 664浏览 2025-05-08 IP属地: 未知

2025年5月7日,理想汽车推出“理想AI Talk第二季——理想VLA司机大模型,从动物进化到人类”,理想汽车董事长兼CEO李想重点分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。


理想汽车VLA司机大模型,在成长中解决问题
编辑

李想将AI工具分为三个层级,分别是信息工具、辅助工具和生产工具。目前,大多数人将AI作为信息工具使用,但信息工具常伴随大量无效信息、无效结果和无效结论,仅具参考价值。成为辅助工具后,AI可以提升效率,例如现在的辅助驾驶,但仍需人类参与。未来,AI发展为生产工具后,将能独立完成专业任务,显著提升效率与质量。

李想表示:“判断Agent(智能体)是否真正智能,关键在于它是否成为生产工具。只有当人工智能变成生产工具,才是其真正爆发的时刻。就像人类会雇佣司机,人工智能技术最终也会承担类似职责,成为真正的生产工具。”

VLA的实现不是突变的过程,是进化的过程

目前的L2、L2+组合驾驶辅助仍属于辅助工具阶段,而VLA(Vision-Language-Action Model,视觉语言行动模型)能够让AI真正成为司机,成为交通领域的专业生产工具。对理想汽车而言, 未来的VLA就是一个像人类司机一样工作的司机大模型”。


理想汽车VLA司机大模型,在成长中解决问题
编辑

VLA的实现不是一个突变的过程,是进化的过程,经历了三个阶段,对应理想汽车辅助驾驶的昨天、今天和明天。第一阶段,理想汽车自2021年起自研依赖规则算法和高精地图的辅助驾驶,类似“昆虫动物智能”。第二阶段,理想汽车自2023年起研究,并于2024年正式推送的端到端+VLM(Vision Language Model,视觉语言模型)辅助驾驶,接近“哺乳动物智能”。

端到端模型在处理复杂问题时存在局限,虽可借助VLM视觉语言模型辅助,但VLM使用开源模型,使其在交通领域的能力有限。同时端到端模型也难以与人类沟通。为了解决这些问题并提升用户的智能体验,理想汽车自2024年起开展VLA研究,并在多项顶级学术会议上发表论文,夯实了理论基础。


理想汽车VLA司机大模型,在成长中解决问题
编辑

在端到端的基础上,到第三阶段,VLA将开启“人类智能”的阶段。它能通过3D和2D视觉的组合,完整地看到物理世界,而不像VLM仅能解析2D图像。同时,VLA拥有完整的脑系统,具备语言、CoT(Chain of Thought,思维链)推理能力,既能看,也能理解并真正执行行动,符合人类的运作方式。

VLA训练过程模拟人类学习,对齐人类价值观

VLA的训练分为预训练、后训练和强化训练三个环节,类似于人类学习驾驶技能的过程。预训练相当于人类学习物理世界和交通领域的常识,通过大量高清2D和3D Vision(视觉)数据、交通相关的Language(语言)语料,以及与物理世界相关的VL(Vision-Language,视觉和语言)联合数据,训练出云端的VL基座模型,并通过蒸馏转化为在车端高效运行的端侧模型。

后训练相当于人类去驾校学习开车的过程。随着Action(动作)数据的加入——即对周围环境和自车驾驶行为的编码,VL基座变为VLA司机大模型。得益于短链条的CoT,以及Diffusion扩散模型对于他车轨迹和环境的预测,VLA具备实时性的特点,实现了在复杂交通环境中的博弈能力。


理想汽车VLA司机大模型,在成长中解决问题
编辑

强化训练类似于人类在社会中实际开车练习,目标是让VLA司机大模型更加安全、舒适,对齐人类价值观,甚至超越人类驾驶水平。强化训练包含两部分:一是通过RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)完成安全对齐,使模型遵守交通规则,贴合中国用户的驾驶习惯;二是将纯强化学习模型放入世界模型中训练,提升舒适性,避免碰撞事故,遵守交通规则。经过预训练、后训练和强化训练后,VLA司机大模型即可部署至车端运行。

VLA司机大模型以“司机Agent(智能体)”的产品形态呈现,用户可通过自然语言与司机Agent沟通,跟人类司机怎么说,就跟司机Agent怎么说。简单通用的短指令由端侧的VLA直接处理,复杂指令则先由云端的VL基座模型解析,再交由VLA处理。

超级对齐确保AI决策安全,世界模型破解AI黑盒难题

除了提升专业能力,VLA司机大模型还需解决安全性和模型黑盒的问题。

模型能力越强,越需要职业性约束,以确保能力下限。为了保障VLA司机大模型能够实现职业司机般的安全和舒适,避免学习加塞等违规行为,理想汽车在强化训练环节投入大量资源,并于2024年底组建超过100人的超级对齐团队,相当于为司机Agent注入职业素养。

为解决模型的黑盒问题,理想汽车结合重建和生成两种路径,打造了真实、符合物理世界规律的世界模型,覆盖所有交通参与者和要素。基于世界模型的仿真能力,VLA可以在世界模型中低成本、准确地验证现实问题,提升解决问题的效率,有效应对模型黑盒带来的挑战。

判断司机Agent是否是个好司机,有三个关键标准:专业能力、职业能力和构建信任的能力。VLA司机大模型提升了专业能力,超级对齐增强了职业能力,VLA通过理解自然语言、具备记忆能力提升了构建信任的能力。

人工智能时代,扎实的基本功比走捷径重要

理想汽车实现技术快速跃迁的背后,是从研究、研发到能力表达,再到将能力变成业务价值的基本功积累。研究是关键,研究突破后,研发的效率会大幅提升,且注重价值转化,最终实现业务落地。

理想汽车坚持自研,通过技术赋能用户价值。例如,在辅助驾驶方面,由于英伟达Orin-X芯片无法直接运行语言模型,端到端+VLM的辅助驾驶方案对部分企业来说仍具挑战。理想汽车依托自有编译团队,自研底层推理引擎,使芯片可通过INT4(4比特整型)量化的方式运行VLM。同时,凭借芯片、控制器设计和自研汽车操作系统等综合能力,理想汽车实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。李想表示,大型企业的基本功和能力永远无法被逾越。

得益于DeepSeek的开源,理想汽车在VLA司机大模型的语言能力研发上提速显著,节省了近9个月的时间和数亿元成本。尽管如此,理想汽车仍选择加大投入,在基座模型上投入超预期3倍的训练卡,专注打造适配多场景的自研模型。李想表示:“我们可以站在巨人的肩膀上,但它只是其中的一部分。”在受益开源的同时,理想汽车也选择开源自研的汽车操作系统——理想星环OS,回馈社会。

成长带来能量,在痛苦中保持正能量

今年7月,理想汽车将迎来成立十周年。李想表示,创业路上苦多于甜,他选择保留那些有价值的美好片段,用来激励自己保持正能量。“创业确实不容易,但是没必要苦哈哈的。苦和甜是一个硬币的正反面,取决于看哪一面。”他将企业遭遇的打击视为必须面对的挑战,也正是这些挑战,赋予了理想汽车更多的能力。也正因这份积极乐观的创业心态,理想汽车才能快速成长为千亿营收规模、百万交付量的新势力企业。

谈及如何成为更有能量的人,李想认为,关键在于关注自我,接受自身的优点和不足,并用成长替代改变——成长意味着增强能力。除此之外,李想强调亲密关系同样重要,关注他人的成长也能带来能量,家人和同事能够和他形成互补,相互支撑。“我需要家人和同事甚至超过了他们需要我,首先是我需要他们,然后才是他们需要我,我们在一起能够形成非常强的脑力和心力。”李想表示。

回顾几次创业经历,李想表示,从高中创办个人网站至今,自己的思维方式没有什么变化:遇到问题解决问题,解决别人不愿解决的难题,解决用户的痛点,不断向他人学习。不同的是,如今面临的问题更复杂、服务的用户群体更多、公司规模和组织也更庞大。“几次创业一路走来,最难时有人相助,遇坑也能迅速爬出,一帮人齐心协力变得更好,这是种幸运,也没什么可后悔的。”

面对AI的发展,李想认为,在AI面前所有的人性都应被保留,无论好坏,因为一切人性都是文化、生命、性格、能力的特质,也是人类真正的生命力所在。

从使用增程电动和5C超充技术解决电池成本高、充电难、充电慢的问题,到自研汽车操作系统攻克传统汽车操作系统性能差、开发缓慢、芯片匹配周期长等挑战,理想汽车始终以技术创新解决行业无法解决的问题。自研VLA时,理想汽车更是踏入了人工智能的无人区。当前,辅助驾驶走到了新的十字路口上,理想汽车将不断挑战成长的极限,持续为行业和用户创造价值。

文章标签:
汽车历史
 
相关推荐
  • 2025初学者必看:快3老师带赚计划app

    2025初学者必看:快3老师带赚计划app【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日......

    101浏览 评论
  • 央企新能源标杆!深蓝S09如何重塑家庭出行新体验?

    央企新能源标杆!深蓝S09如何重塑家庭出行新体验?

    1837浏览 评论
  • 2025最新掌握:快3聊天室计划群

    2025最新掌握:快3聊天室计划群【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同风起,......

    U车动态 关注
    107浏览 评论
  • 大师百科:快3看规律走势的方法

    大师百科:快3看规律走势的方法【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同风起,一步......

    124浏览 评论
  • 快速获取:快 3的必中计划公式(三期技巧)

    快速获取:快 3的必中计划公式(三期技巧)【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日......

    137浏览 评论
  • 2025重磅科普:快3的全部计划玩法三期必中

    2025重磅科普:快3的全部计划玩法三期必中【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一......

    124浏览 评论
  • 超全指南!快3的所有计划分享

    超全指南!快3的所有计划分享【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同风起,一步登......

    光看车 关注
    96浏览 评论
  • 英国超级跑车的短暂辉煌 Spectre R42

    Spectre R42是1990年代英国汽车工业中一颗璀璨却短暂的明星,它承载着福特GT40精神传承的使命,却最终成为了汽车历史上的遗珠。这款车的故事始于一个对经典赛车充满热情的工程师雷·克里斯托弗,他曾是GT Developments公司的联合创始人,该公司以制造高质量的福特G......

    2513浏览 评论
  • 知识详解:快 3玩法十大技巧和值规律

    知识详解:快 3玩法十大技巧和值规律【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同风起......

    87浏览 评论
  • “Hi4 Talk嗨聊会”第二期开播,长城新能源越野技术到底有多强?

    “Hi4 Talk嗨聊会”第二期开播,长城新能源越野技术到底有多强?

    338浏览 评论
  • 2025年科普:快 3的全部和值计划玩法

    2025年科普:快 3的全部和值计划玩法【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同......

    光看车 关注
    92浏览 评论
  • 2025科普:快3全面计划平台攻略(详细版)

    2025科普:快3全面计划平台攻略(详细版)【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一......

    U车动态 关注
    141浏览 评论
  • 增程插混技术对比

    前段时间有朋友选车在纠结插混还是增程

    166浏览 评论
  • 2025陕西鸿蒙智行车主生活节来了,享界S9解锁未来新出行

    从6月27号开始到6月29号的鸿蒙智行生活节将在曲江体育杜邑足球公园正式举办。在本次的展会上,鸿蒙智行旗下的享界S9增程版、问界M9、智界R7等等车型以及HUAWEI MateBook Fold等3C产品这些产品都会在这里亮相

    2350浏览 评论
  • 2025重磅科普:福彩快 3导师带人倍投

    2025重磅科普:福彩快 3导师带人倍投【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同......

    163浏览 评论
  • 下半年买SUV的有福了!5款全新SUV实车现身,谁能打动你?

    还在为下半年不知道该等哪台全新的SUV而着急?别担心,今天我就给你们来盘点已经于近期曝光过实车的5款全新SUV,一般来说,只要实车被曝光了,车辆离正式上市的时间也就不远了。但是,就是不知道这些车型谁最能够打动你呢?让我们一起来了解下。

    1763浏览 评论
  • “灵动出奇 城市漫游”,和米奇一起开着smart逛山城

    smart主题巡游继首站落地成都、苏州后,6月26日巡游同时来到重庆和杭州,smart家族全明星阵容同场助阵,与密友一起灵动出奇。

    Benchmarker 关注
    1880浏览 评论
  • 2025新手必看:快 3老师稳赢计划有哪些

    2025新手必看:快 3老师稳赢计划有哪些【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日......

    撩车侠 关注
    113浏览 评论
  • 盘点科普:快3精准计划

    盘点科普:快3精准计划【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同风起,一步登天九万......

    117浏览 评论
  • 2025总结科普:快 3的计划和技巧

    2025总结科普:快 3的计划和技巧【罔——AM898.CC——】【罔——66HF.CC——】〖吉祥如意〗〖好运连连〗〖隆运当头〗〖共创光辉〗PIDANDOUFU没有那么多天资异禀,优异的人总是极力的奔走风尘,要么不做,要做就做第一!须知少年凌云志,曾许人世最风流,大鹏一日同风起......

    124浏览 评论
  • 已无数据
主播说车 398粉丝    1474作品 关注 新车测评、汽车百科、选车导购、车型详解,尽在主播说车~
推荐作者
电车男EVman 关注
第二懂新能源车的男人
阿飞频率 关注
喜欢车爱聊车,喜欢把自己的爱好跟大家分享。
大付撕车 关注
大付撕车是汽车视频类栏目。栏目主张正确的选车观,为重度选车纠
华南车市资讯 关注
立足华南区域,打造本地化的汽车资讯,接地气的专业汽车报道。
闫闯说车 关注
闫闯说车团队会给大家带来最新,最全面的车型评测视频敬请关注。
Techtec杨磊 关注
汽车ECU改装高级工程师,汽车改装维修专家。德国Techtec汽车性能
二手车大智慧潘 关注
中国二手车自媒体联盟联合发起人,行业深度观察者。
来试车 关注
汽车视频自媒体 试驾评测 汽车工作的Vlog 每周持续更新
全部爱咖号