当前位置 爱咖号首页 理想AI Talk第二季上线,最新的VLA视觉模型到底是什么?

理想AI Talk第二季上线,最新的VLA视觉模型到底是什么?

丁丁说车 2319浏览 2025-05-08 IP属地: 未知

2025年5月7日,理想汽车召开"理想AI Talk第二季"技术发布会,重点介绍了最新研发成果VLA司机大模型系统。该技术被定义为面向交通领域的专业生产工具,旨在实现接近人类司机水平的自动驾驶功能。我简化了一下整个谈话过程,并直接把结论列出来,让大家可以快速的明白理想在AI领域的发展方向以及思路。

在技术演进路径方面,理想汽车展示了三阶段发展路线:


2021-2022年:基于规则算法与高精地图的辅助驾驶系统


2023-2024年:端到端架构结合视觉语言模型(VLM)的辅助驾驶系统


2025年:具备多模态感知与决策能力的VLA(视觉语言行动)司机大模型


技术架构显示,VLA系统采用三阶段训练机制:


预训练阶段:通过超300PB的2D/3D视觉数据与交通语料构建基座模型


后训练阶段:引入动作编码数据与短链条思维链推理技术


强化训练阶段:运用RLHF(人类反馈强化学习)与世界模型仿真技术进行安全校准


安全性验证方面,研发团队披露:


组建超过100人的安全对齐团队


构建覆盖全要素的交通世界模型


累计完成超1000万公里的虚拟仿真测试


硬件适配方面,技术团队通过自研推理引擎实现:


INT4量化技术使Orin-X芯片支持语言模型运算


Thor-U芯片与双Orin-X芯片实现算力均衡


在模型研发过程中:


使用DeepSeek开源框架节省约9个月研发周期


投入超过行业平均水平3倍的计算资源进行基座训练


向开源社区贡献自研车载操作系统代码


企业相关负责人表示,该技术已通过国家智能网联汽车创新中心第三方验证,计划于2026年逐步实现城市道路场景应用。公司同时披露,相关技术论文已被NeurIPS、CVPR等学术会议收录。


在媒体问答环节,理想汽车董事长李想就技术发展提出观点:

"自动驾驶系统的智能程度应以能否承担完整驾驶任务为评判标准。当前行业普遍处于辅助工具阶段,向生产工具演进需要突破多模态协同与价值对齐两大技术瓶颈。"


关于企业发展战略,李想透露:


研发投入连续三年保持40%以上复合增长率


技术团队规模扩展至3000人,其中博士占比15%


计划在2025Q3发布开源工具链LISA 2.0


值得关注的是,工信部最新数据显示,我国L2+级自动驾驶渗透率已达62%,但专业生产工具级系统仍处于验证阶段。行业专家指出,视觉大模型与行动策略的协同优化、长尾场景应对能力、系统可解释性等关键技术仍需持续突破。

文章标签:
行业分析
 
相关推荐
丁丁说车 5.4万粉丝    1695作品 关注 一个有营养的汽车自媒体,消费|科技|文化|生活
推荐作者
汽车鉴闻 关注
汽车媒体技术编辑 汽车售前售后事儿,用车养车百家通
柿柿车 关注
汽车媒体编辑,参与C-NCAP试验报道
肆哥车讯 关注
购车无小事,选车无难事。
凤眼观车 关注
来一起快乐的撩车吧!
电车男EVman 关注
第二懂新能源车的男人
予墨Auto 关注
跟我们一起慢慢懂车!
车轮哥 关注
记录老外在中国的汽车生活。
全部爱咖号