当前位置 爱咖号首页 理想AI Talk第二季上线,最新的VLA视觉模型到底是什么?

理想AI Talk第二季上线,最新的VLA视觉模型到底是什么?

丁丁说车 2319浏览 2025-05-08 IP属地: 未知

2025年5月7日,理想汽车召开"理想AI Talk第二季"技术发布会,重点介绍了最新研发成果VLA司机大模型系统。该技术被定义为面向交通领域的专业生产工具,旨在实现接近人类司机水平的自动驾驶功能。我简化了一下整个谈话过程,并直接把结论列出来,让大家可以快速的明白理想在AI领域的发展方向以及思路。

在技术演进路径方面,理想汽车展示了三阶段发展路线:


2021-2022年:基于规则算法与高精地图的辅助驾驶系统


2023-2024年:端到端架构结合视觉语言模型(VLM)的辅助驾驶系统


2025年:具备多模态感知与决策能力的VLA(视觉语言行动)司机大模型


技术架构显示,VLA系统采用三阶段训练机制:


预训练阶段:通过超300PB的2D/3D视觉数据与交通语料构建基座模型


后训练阶段:引入动作编码数据与短链条思维链推理技术


强化训练阶段:运用RLHF(人类反馈强化学习)与世界模型仿真技术进行安全校准


安全性验证方面,研发团队披露:


组建超过100人的安全对齐团队


构建覆盖全要素的交通世界模型


累计完成超1000万公里的虚拟仿真测试


硬件适配方面,技术团队通过自研推理引擎实现:


INT4量化技术使Orin-X芯片支持语言模型运算


Thor-U芯片与双Orin-X芯片实现算力均衡


在模型研发过程中:


使用DeepSeek开源框架节省约9个月研发周期


投入超过行业平均水平3倍的计算资源进行基座训练


向开源社区贡献自研车载操作系统代码


企业相关负责人表示,该技术已通过国家智能网联汽车创新中心第三方验证,计划于2026年逐步实现城市道路场景应用。公司同时披露,相关技术论文已被NeurIPS、CVPR等学术会议收录。


在媒体问答环节,理想汽车董事长李想就技术发展提出观点:

"自动驾驶系统的智能程度应以能否承担完整驾驶任务为评判标准。当前行业普遍处于辅助工具阶段,向生产工具演进需要突破多模态协同与价值对齐两大技术瓶颈。"


关于企业发展战略,李想透露:


研发投入连续三年保持40%以上复合增长率


技术团队规模扩展至3000人,其中博士占比15%


计划在2025Q3发布开源工具链LISA 2.0


值得关注的是,工信部最新数据显示,我国L2+级自动驾驶渗透率已达62%,但专业生产工具级系统仍处于验证阶段。行业专家指出,视觉大模型与行动策略的协同优化、长尾场景应对能力、系统可解释性等关键技术仍需持续突破。

文章标签:
行业分析
 
相关推荐
丁丁说车 5.4万粉丝    1691作品 关注 一个有营养的汽车自媒体,消费|科技|文化|生活
推荐作者
车大拿TV 关注
看车,选车,买车,玩车
凤眼观车 关注
来一起快乐的撩车吧!
汽车新说 关注
一个有关于汽车的漏网之语,正在一本正经的胡说八道。
汽车匠人 关注
寻求在互联网时代用匠心精神
车市八爷 关注
宁波最知名的汽车新闻主流媒体之一,爱卡分享一手新闻、新车、评测
来试车 关注
汽车视频自媒体 试驾评测 汽车工作的Vlog 每周持续更新
21世纪车评 关注
21世纪专业汽车资讯,改装资深专家
靓车大咖会 关注
了解最新汽车资讯,汽车养护知识
全部爱咖号