当前位置 爱咖号首页 交通领域专业生产工具,理想汽车发布VLA司机大模型

交通领域专业生产工具,理想汽车发布VLA司机大模型

踢车帮 2789浏览 2025-05-08 IP属地: 未知

2025年5月7日,理想汽车在“理想AI Talk第二季——理想VLA司机大模型,从动物进化到人类”线上活动中,推出VLA(Vision-Language-Action Model,视觉语言行动模型)司机大模型,理想汽车董事长兼CEO李想分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。

李想将AI工具划分为信息工具、辅助工具和生产工具三个层级。目前多数人使用的 AI仅为信息工具,存在大量无效信息。而目前的L2、L2+组合驾驶辅助仍处于辅助工具阶段,仍需人类参与。理想汽车的VLA司机大模型则致力于成为交通领域的专业生产工具,这意味着未来,VLA将会是像人类司机一样工作的司机大模型,大幅提升效率与质量。

VLA的发展是经历了三个阶段的进化的过程,而非突变。第一阶段,2021年自研依赖规则算法和高精地图的辅助驾驶类似 “昆虫动物智能”。第二阶段,自2023年起研究,并于2024年正式推送的端到端+VLM辅助驾驶接近“哺乳动物智能”,但存在局限性。

在端到端的基础上,到第三阶段,VLA司机大模型将开启“人类智能”阶段,它能通过3D和2D视觉组合,完整地感知物理世界。同时,VLA拥有完整的脑系统,具备语言和思维链推理能力,可理解并执行行动,符合人类的运作方式。

在训练过程中,VLA模拟人类学习驾驶的过程,分为预训练、后训练和强化训练。预训练通过大量视觉和语言数据,训练出云端VL基座模型并转化为端侧模型。后训练加入动作数据,让模型具备在复杂交通环境中的博弈能力。强化训练则通过基于人类反馈的强化学习和世界模型训练,使模型更加安全、舒适,符合人类驾驶习惯。最终,以“司机Agent(智能体)”形态呈现的VLA司机大模型,支持用户用自然语言沟通,简单指令由端侧处理,复杂指令经云端解析后处理。

除了提升专业能力,VLA司机大模型还需解决安全性和模型黑盒的问题。模型能力越强,越需要职业性约束,以确保能力下限。为了保障VLA司机大模型能够实现职业司机般的安全和舒适,避免学习加塞等违规行为,理想汽车在强化训练环节投入大量资源,通过组建超100人的超级对齐团队,为司机Agent注入职业素养,确保其安全驾驶。同时打造世界模型,结合重建和生成路径,覆盖所有交通要素,利用仿真能力有效验证现实问题,破解模型黑盒难题。

人工智能时代,扎实的基本功比走捷径重要。理想汽车在辅助驾驶技术上,自研底层推理引擎,让不同芯片能够通过量化的方式运行端到端+VLM的辅助驾驶方案,并实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。此外,借助 DeepSeek开源技术,理想汽车在语言能力研发上节省大量时间和成本,同时加大投入打造自研模型,还开源自研的汽车操作系统——理想星环OS回馈社会。

李想在活动中还分享了创业与个人成长的感悟。他认为创业虽充满挑战,但积极的心态至关重要,应将挑战视为成长的机遇。在个人成长方面,关注自我、接受自身优缺点并注重成长,同时重视亲密关系,相互支撑共同进步。

理想汽车在智能驾驶领域不断创新,VLA司机大模型的推出是其重要的里程碑。未来,理想汽车将继续挑战成长极限,为行业发展和用户体验创造更多价值,引领智能驾驶行业迈向新的发展阶段。

本文作者为踢车帮 余天

文章标签:
新车爆料
 
相关推荐
踢车帮 33.8万粉丝    5256作品 关注 只为爱车的你!
推荐作者
苑叔聊车 关注
资深的汽车编辑,阅车无数,有关于选车的问题找我就没错了。
弯道看车 关注
资深车评人,前《深圳特区报》汽车部主任
中国皮卡网 关注
皮卡车垂直门户网站,中国汽车工业协会皮卡分会理事单位。
凤眼观车 关注
来一起快乐的撩车吧!
SCC超跑俱乐部 关注
SCC超跑俱乐部
xuser3801153 关注
蓝鲸车市
二手车大智慧潘 关注
中国二手车自媒体联盟联合发起人,行业深度观察者。
靓车大咖会 关注
了解最新汽车资讯,汽车养护知识
全部爱咖号