理想AI Talk第二季的核心内容还是之前理想在英伟达GTC大会上的那篇演讲《VLA:迈向自动驾驶物理智能体的关键一步》,只是这次主讲人换成了李想,也补充了一些更详细的信息。
1、 理想做了一个32B云端VL基座模型,这个模型是专门用于视觉和语言的多模态基座大模型,可以处理长思维链、进行长任务拆解。同时蒸馏出一个3.2B的小模型,加上Action后训练部分,组合成一个4B的VLA司机大模型,这样双Orin X或者Thor-U的算力就能在车端跑了。并且因为DeepSeek的开源,让VLA研发加速了9个月的时间。
2、 理想的VLA司机大模型有两个比较特别的地方,一是支持短CoT(思维链),一般两步到三步,否则延时太长,这样能够确保安全。这种短CoT可以解决比如“靠边停车”“前方掉头”这类短指令,实现语音控制车辆轨迹。另外Action做完以后,还做了一个diffusion(扩散模型)的预测,这个主要根据性能会做来4到8秒的一个diffusion的轨迹和环境的预测,更接近人类驾驶。
3、 理想在做到了1000万Clips以后,在去年底成立了一个约100人的超级对齐的团队。这个团队要做的事情是VLA大模型的“价值观”要和人类驾驶规则对齐。比如模型能力很强,但不遵守交通规则、经常去加塞等等,做出来一些让人类坐在车上感觉不安的行为。所以理想希望通过强化训练的环节,必须把人类的这些规则、习俗、驾驶习惯,对于很多东西的判断,变成整个预训练的反馈。
4、 李想个人认为并不会出现通用的Agent,而是每个专业领域做专业的Agent。他认为,VLA司机大模型要做好,所有的vision的语料,language的语料,和action其实都是和交通相关的,做不了一样的。
5、 关于端到端和VLA的关系,李想认为端到端是VLA的基础,是VLA的A的部分,不做端到端+VLM是没有办法一步抵达VLA的。
6、 李想反驳了那些说理想只有冰箱彩电大沙发、没有核心技术的说法。他举了一个例子,为什么大家做端到端和VLM很难?是因为这个Orin芯片并不支持直接跑语言模型。但是理想有编译团队,有芯片的能力,有主板设计能力,有操作系统能力,所以理想能够把两个Orin-X带宽做到足够的大,它同样可以跑同等规模的VLA的模型。理想这方面的技术都是非常扎实的,基本功和能力永远是无法逾越的。
文|JackieLXX
图|网络
全系标配380?2025款途观L Pro正式上市!高能、高智、高优惠!
车长超过5.4米,全新魏牌高山9带来了绝对的大空间,“超大杯”的快乐值得拥有?
难度不小,但并非没有可能。
谁是家用MPV黑马?GL8陆尚详细试驾体验,比丰田赛那好在哪?
问界M8卖的好|情绪价值给不少
朱华荣董事长化身销售,阿维塔势能为何如此强,都有哪些护城河
16.98万起 全新中大型SUV 海狮07DM-i上市
燃油车时代,选择大型SUV总要面对一道无解题,要全家出行的宽敞空间,就得忍受地库里狼狈的「三把轮」掉头;想拥有旗舰级的气场,就得在窄巷里化身「人工倒车雷达。而腾势N9带着4.65米转弯半径震撼发布后,这个困扰车圈多年的现象可以说直接被打破。
北京时间 5 月 6 日凌晨在 2025 斯诺克世界锦标赛决赛上 中国选手赵心童战胜马克・威廉姆斯 成为首位夺得斯诺克世锦赛冠军的中国及亚洲选手 在其夺冠之路上比亚迪海狮 07EV 是他在英国训练和比赛期间的出行伙伴
一直很好奇比亚迪王朝的全新旗舰SUV唐L,究竟开起来会比以往我们熟悉的比亚迪有什么不一样,更年轻的设计更高端的定位,蕴藏着比亚迪什么样的野心?
小鹏飞行汽车207万的价格依然在上海车展获260张订单 引领未来出行潮流
源自SMA超级混动架构,定位豪华中大型插混SUV,全新沃尔沃XC70怎么样?
2025年4月,零跑汽车单月交付量41039台,同比增长173%,以科技+品质持续引爆市场,再写增长新篇!
比亚迪海狮07EV护航赵心童夺冠,全球销冠品牌再添星光
上海车展亮剑!北京越野携BJ40增程、BJ40增程赤兔版震撼登场
【E汽车】限时25.99万起售 2025款阿维塔12“焕新”上市
当硬派越野基因邂逅极致智能科技,铁血猛士遇上满血华为,电动越野的进化将走向何方?
比亚迪海狮07DM-i 正式上市,售价16.98万元-20.58万元
插电混动汽车抢桩现象的本质:心态从既要、又要,逐步转变为只要
关于车企高负债,藏在年报里的真相你知道多少?