当前位置 爱咖号首页 极越 01,只靠眼睛「进城」?

极越 01,只靠眼睛「进城」?

类星频道 1689浏览 2023-10-19 IP属地: 上海

10 月 17 日,极越官方正式公布一镜到底的城市 NOA (城市领航辅助驾驶)视频和 OCC Demo 视频。OCC Demo 的亮相也意味着极越智驾在下一阶段将会采用 Occupancy Network(占用网络),进一步强化视觉方案能力。

极越 01,只靠眼睛「进城」?

极越 01 也将在今年 10 月底开启交付,交付即可开通城市 NOA 能力,首批开通城市中上海已然板上钉钉。这不免产生了一个疑问?极越能够在 2023 年迅速落地城市 NOA,极越是如何做的?

视觉进化之旅

极越有着百度 Apollo 的加持,在智驾领域含着金钥匙出生,在早期研发阶段,极越就以「视觉为主 + 激光雷达」融合的智驾方案为路线进行研发,两套独立的系统相互备份、相互补充。

通过激光雷达进行异形障碍物检测和更优的测距能力,将激光雷达产生的数据不断喂养视觉模型,帮助城市 NOA 的视觉能力更快成长。

极越 01,只靠眼睛「进城」?

现阶段 BEV + Transformer 技术已经被很多头部玩家熟练应用,提供更优秀的感知能力。极越这次表现更为激进,官方展示的这段极越 01的智驾视频已经不依赖激光雷达,通过视觉方案跑通了这次在上海市中心「溜达」的视频。

对于激光雷达,其实车企也都在弱化 Ta 的作用,何小鹏就曾表示过,小鹏的车型使用激光雷达主要是为了打辅助,对安全性进行冗余。

摆脱了激光雷达,谁来代替呢?

答案是 Occupancy Network,也就是占用网络。

占用网络最早由 Tesla 在 2022 年的 CVPR 上提出,这也是 Tesla 为了解决纯视觉感知方案劣势的新方法。

极越 01,只靠眼睛「进城」?

简单来说,马路上可以出现任何新兴物体,机器不可能 100% 学习过,这对于视觉来说是最大的阻碍,所以占用网络将 3D 世界划分为一个个网格单元,然后通过深度神经网络来预测哪个网格单元被占用,又有哪些没被占用。

极越 01,只靠眼睛「进城」?

极越这次给出的视频 Demo 则更为清晰,通过体素(Voxel)化的方式理解和处理空间信息。换个说法,一张照片由极多像素点组成,极越感知到的世界由体素组成,可以在下图中很明显的看到车辆在遇到施工场景时,体素还原出来的 3D 世界是什么样的,感知系统可以对通行区域进行高度还原,并不需要考虑物体是什么,只需要考虑体素是否被占用即可。

这和激光雷达实现的功能类似,主要是面对异形障碍物感知能力的补充,来解决路面上可能出现的「巨石」、「拉满钢管的三轮车」、「奇奇怪怪的路障」等等。

这样视觉感知即便没有进行学习过,也可以知道前面有物体,不能通过,进一步减少了 Corner case 的出现,来取得更好的安全性。与此同时,摄像头采集的信息相对更加丰富,所以占用网络在理论上对于 3D 场景的还原上限更高。

值得一提的是,消息人士透露,极越的占用网络技术已经具备量产能力,如果近期能够上车,极越大概率会成为国内首个采用占用网络视觉方案的车企。

现阶段视觉方案基本属于大势所趋,其他车企也在不断跟进。2021 年的时候,大家还在比谁家激光雷达更多,更有长城机甲龙拿出了四颗激光雷达。不到两年的时间,华为从阿维塔 11 和极狐阿尔法 S 两台车上的 ADS 1.0,迭代到今天问界 M5 和 M7 两台车上的 ADS 2.0,激光雷达也从 3 颗变成了 1 颗。

极越 01,只靠眼睛「进城」?

算法创新一方面是硬件成本的下降,激光雷达动辄几千元的售价,最终的成本都会落到消费者身上。这点在 Tesla 身上非常明显,北美 FSD Beta 的表现可谓独树一帜,但只要升级过 HW3.0 硬件的车型都可以随时开通 FSD Beta,并不会区分高低配。而国内市场往往需要考虑硬件成本通过高低配车型来进行区分智驾方案。

另一方面视觉的智驾方案系统更加精简,更加有利于大规模的场景泛化,这又要提到一个问题,图。

现阶段国内所有的城区智驾都是有高精地图作为底座,毕竟前方路况能「剧透」,谁不想知道呢?但从商业角度来说基于高精地图让全国人民都用上城区智驾几乎不可能,而在先行者们的不断实践中,高精地图的鲜度又成为了大问题,当高精地图更新不及时,高阶智驾就完全不能用,所以行业里逐渐形成了降低了高精地区的权重。

当然,我们对于消费者来说,激光雷达?高精地图?感知?都不重要,结果才重要。一起来看看极越官方公布的两个视频有哪些细节值得挖一挖?

进城啦

趁热打铁,先来看看这段 OCC Demo 的 GIF。

这是一个极其常见的避障场景,可以从 GIF 看到,车辆前方有一台大货车、隔离带和一台作业车辆,而占用网络清晰的将信息进行区隔,甚至绿化带和路肩都通过明显的颜色来区分不同的交通元素。

而其中隔离带并非常见的桩桶,这对于没有采用占用网络的视觉算法就有些挑战了。但通过 OCC 加持后,车辆会很明显知道前方有一个高度超过半米的障碍物,这和激光雷达在感知层面的作用有着异曲同工之处。

下面这段 GIF 可以发现这套感知系统有很强的识别能力,路边的路灯和树木混在一起,但通过颜色可以看出 OCC 可以清晰地区别出它们。

说完占用网络,再来看看极越在上海市中心的表现,路线是从陆家嘴绕外滩一圈,时间是在周日下午 17 点前后,整体车流算是一个正常通行水平,地面道路、隧道、高架等等场景基本都覆盖了,可惜没有我想看的环岛,但整体难度不低。

再聊具体表现前,先说下极越 01 可视化的表现,以紫色作为主体色,显示非常明显,特别是 PPA(点到点领航辅助),开启后显示清晰。在使用智驾的时候偶尔会遇到降级的情况,如果图标显示不清晰就会造成误解。

从可视化中还可以发现,系统选择的车道也会有明确的指引来告诉驾驶员要怎么走,执行起步、变道、转向等等动作时也会有明显的文字来提醒车辆要在做什么。详细的可视化能力可以极大地提高驾驶员在使用高阶智驾时的安全感,毕竟大多数的恐惧感都来自于未知。

初级任务 —— 避障。路口有施工场景,并且有一个桩桶侵入车道,从车机的可视化中不难看到车辆感知系统识别到了桩桶,并进行了规避动作。

同样还有一个清扫车路边停车的场景,车尾侵入车道,极越 01 也轻松完成避障,并且向左避障时打开了转向灯。

中级任务 —— 避人。从图中可以看到极越 01 正在避让占道的非机动车,从时速表上来看减速比较平缓,可视化准确显示非机动车位置,而在控制方面极越 01 并没有选择刹车,而是降速跟车。不过这个场景其实可以处理的更好一些,中间车道有几秒钟是没有车辆通行的,如果执行变道动作可以进一步提升通行效率。

高级任务 —— 预测。人类驾驶员新手司机和老司机的区别是什么?往往就在于预测道路和车辆轨迹的能力,老司机可以找到通行效率更快的路线,通过经验可以知道哪些地方需要预备刹车,以防止突然出现的鬼探头等情形。

这段测试视频中我也发现了极越 01 一个非常老司机的行为,通过减速来防止鬼探头的场景出现。经过路口时车辆右侧被大货车挡住,并且货车刹车灯已经亮起,相信多数司机都是加速通过绿灯,但极越 01 多想了一步,稍微减速确定安全后,加速通过路口。补充一点,这次路线选择中有上海的南浦大桥,在上桥时还是会面对大曲率弯道,极越在速度和稳定性上都还不错。

通过这次上海市中心极越 01 PPA 路试的表现,可以明显感受到极越除了在感知层面外,在决策和控制层面的能力也并不弱。一键开启、全程 0 接管的表现、可圈可点的可视化都让 PPA 更容易上手,增强使用智驾信心的同时降低使用门槛。

写在最后

现阶段高阶智驾特别是城市 NOA 能力依然是头部玩家中的「如来神掌」,只有华为和小鹏两家走在前面,而极越 01 在 10 月底交付之后,将成为第三家进入城市 NOA 梯队的玩家,如果此次发布的纯视觉方案于本次极越 01 交付时上车,那么极越将成为国内首位通过视觉方案实现城市 NOA 的玩家,这让每个车企都看到了视觉感知的潜力,这背后也是百度 Apollo 和极越长时间深耕算法的结果。

但是国内智驾领域可谓卷中卷,极越只是短暂的挖掘了一条护城河。期待极越在视觉领域可以进一步深挖这条护城河,开通更多城市的城市 NOA,来强化自身产品的竞争力。

文章标签:
技术解析 新能源
 
相关推荐
类星频道 4680粉丝    317作品 关注 打破信息差,聚焦智能汽车的未来
推荐作者
弯道看车 关注
资深车评人,前《深圳特区报》汽车部主任
汽车鉴闻 关注
汽车媒体技术编辑 汽车售前售后事儿,用车养车百家通
予墨Auto 关注
跟我们一起慢慢懂车!
汽车匠人 关注
寻求在互联网时代用匠心精神
来试车 关注
汽车视频自媒体 试驾评测 汽车工作的Vlog 每周持续更新
悦行江西 关注
和你分享有趣、新鲜和汽车有关或无关的事!
那啥车 关注
每一台车都有自己的灵魂;那啥车?对!我的车。
旅行体质 关注
我将持续更新我近几年在全世界各地旅行的见闻,有视频有图文!
全部爱咖号