当前位置 爱咖号首页 数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

路咖汽车 2775浏览 2022-08-17 IP属地: 北京
数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

每秒产生8GB的数据,相当于你每秒看了5-6部的2K电影,或者是1-2部的4K电影,这就是目前蔚来ET7在开启智能驾驶后每秒产生的数据量,如此大的数据量,车企已经不满足于在本地储存和处理了,数据上云已经成为了基本需求。

随着自动驾驶行业越来越“卷”,车企对云的需求已不满足于仅数据存储本身,尤其是对于蔚来、小鹏、理想等这些自研自动驾驶的车企们,同时对于类似于感知模型训练、仿真测试、研发工具链等对智能汽车云的需求也是越来越旺。自动驾驶数据“上云”已经可以算是最低要求,云端研发自动驾驶才是真需求。

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

蔚小理在云端训练自动驾驶?安全吗?

那么云服务都能为蔚小理们带来什么?它是如何运作的?

云服务给车企带来的不只是效率工具的提升,一个完整的自动驾驶系统闭环由感知、规划、决策构成,其中感知和规划构成了数据生成的主要部分,包括数据采集、数据清洗、数据标注、仿真测试。

云服务内的数据处理方式,是颠覆以往的。随着自动驾驶的感知硬件的不断增加,比如新势力蔚小理它们的新车型,都已经进入了激光雷达时代,数据量是以指数级别累加的,这其中不但包括了摄像头采集的视频、图像,还有激光雷达采集的点云、雷达点云等,甚至还有车路协同模块处理的信息。这其中,大量的数据,或者说绝大多数的数据是几乎没有价值的,而在传统本地时代,这些数据却占据了极大比例的内存。

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

而云服务商可以简化优化这些数据,通过查打标签、以图搜图等方式提取有代表性的场景,就比如我们经常提到的一些场景,比如有着极强明暗变化的隧道,遇到大货车或者其他形态各异的大型车辆,突然蹿出的电动二轮车等,如果要抓取这些信息,那么云端管理人员会下达指令,车辆在本地处理好内容后,就可以把这些类似场景自动提取出来,然后上传云端,避免更多没有价值的数据侵占云端空间。

通过构建高质量数据库与场景集,及时反馈给算法训练,在优化存储空间之余,更快的优化迭代自动驾驶算法。

艰巨的脱敏处理,是上云的重要推动者

信息安全方面的问题,是相当要注意的,在获取到需要的数据前,就要对数据进行清洗和标注,数据清洗就是擦除车端采集的敏感数据,由于其中包含地理位置、人脸、车牌等涉及国家安全和隐私的信息,必须进行脱敏合规处理,并统一格式,而数据标注则是对清洗后的数据进一步加工,大致分为 2D、3D 目标物标注、联合标注、车道线标注和语义分割等。

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

相信今年上半年,众多拥有智能汽车的车主们,都感受到自己的车退化了,比亚迪、长安等车型的实时监控车辆的功能被接二连三的关闭,就是因为数据脱敏、清洗这方面做得很有问题。

在自动驾驶行业内,谁能高效低成本地挖掘数据价值,谁就能成为竞争的王者。但是,无论是数据清洗还是数据标注,都需要大量的人力劳动参与。经过这种方式处理的数据质量质量参差不齐、返工率高,且效率十分低下。即便后来车企慢慢引入本地AI训练数据处理,较人工处理提升并不明显。

但是到了云服务这里,成本会显著降低,基于云端训练复杂神经网络模型,汽车云服务结合深度学习实现自动标注能力提升,优化标注算法效率与精度,降低数据处理成本。有分析指出,汽车云高算力结合智能策略,综合数据处理效率提升10倍以上,数据处理成本较人工降低50%。

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

有钱就自建,没钱得多长几个心眼

这么看下来,这自动驾驶数据上云可真是没有缺点啊,完美符合车企的真是需要,但是为什么真正做到数据上云的车企却不多呢?这样一看,相当的矛盾啊,为什么?

车企上云目前大体可分为两类:自建私有云、采购外包公有云。实力较为强劲的车企或新势力以私有云,比如最近小鹏就建成国内最大的自动驾驶智算中心“扶摇”,但也有一小部分业务需要外采。难点主要在于自建私有云存在成本高、难度大、耗时长的缺点。

同时,很难在研发过程中,应对交付车辆增多,智能驾驶新增数据量暴增而导致的对于更高算力需求,如果对私有云进行扩容,则要购买或租借新的硬件和资源,中间的保密性,以及其他安全性问题会变得严峻起来。

当然,这里还要提到上文说到过的数据量的问题:在自动驾驶研发阶段,如果按照10辆测试车,每年累计采集天数300天估算(一般测试车会天天上路),单车每天可以产生10TB左右的数据量,每年产生的数据总量超过30PB。

而研发阶段的数据量相比于量产车交付之后产生的数据量,那依然是小巫见大巫。

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

虽然车主的量产车不会像测试车那样没日没夜地跑,但车辆总数却呈指数级上涨,头部新势力们和国内自主品牌的交付量大家也都能看到它们销量的火爆。如果按照10万辆车,每年累计采集天数300天估算,那么未来车企所面临的数据总量将会达到ZB级。

换算关系这里明确一下:1ZB=1024EB,1EB=1024PB,而用我们熟悉的TB单位来换算,1ZB约等于10亿多TB。虽然我们上文提到过,可以针对性的进行图像数据抓取,就算几十分之一的数据量,那也是相当恐怖。

数据上云=出卖灵魂?是谁在研发自动驾驶

所以,外采的公有云好像看起来更香,不仅能提供强劲的算力,其数据管理能力也会变得更强,无需车企亲自忙前忙后。这也使得在2020年,公有云规模在2019年超过了私有云,成为中国云计算最主要的市场。

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

车企在享受花钱带来的快乐的同时,就又要不得不思考另一个问题,也就是云供应商如此深层次的介入到自己的自动驾驶研发业务中,这不相当于把自己的七寸掌握在他人之手了吗?背后捅刀子的情况从前也不是没有发生过。而且在一定数据量的积累之后,是谁在自研自动驾驶就真实的成了一个问题。

上文我们提到的那些分析储存过程中的工具链,在出于效率考虑,车企其实更希望单独一家供应商能提供全栈工具链,因为分散合作过程中,自己的主导地位又会不保,就又会把自己架空,安全方面更得不到保障。

而目前选择汽车云服务供应商的重要考量指标,就是能不能把底层耦合拆干净,也就是业务和业务之间的协作并不在于云的一体化,不需要供应商一家独大,车企更看重的是云服务商能不能灵活地适配需求,自己说的话还算不算数。

目前已经有云服务商正在将各模块进行解耦,比如腾讯、阿里、百度以及华为等等,它们所提供的工具链分为数据、训练、仿真、监管四部分,完全开放解耦、不绑定,客户随时可以替换。以实现帮助车企降本增效的同时,保证车企在自动驾驶云端研发过程中的主导权。

数据上云=出卖灵魂?蔚小理正在因为自动驾驶训练犯难

总结

智能汽车云已经成为智能网联汽车行业中不可或缺的一部分,正助力数据在业务应用中发挥出最大价值,并为车企在研发到商用的进程中真正实现降本增效。车企们也正与云厂商大踏步地走向业务层面合作的深水区,如何平衡好它们之间的关系,就成为了相当重要的事情。

在智能驾驶硬件和门槛卷到飞起的今天,车企们其实在云端间的剑拔弩张,也是相当激烈,针对于数据上云,大量车企依然是比较矛盾,归根到底其实还是成本的问题,谁不想什么都掌握在自己手里,可是天量的数据压得大家都喘不过气来,在没有更好的整理精简数据的飞跃式技术出现之前,大部分车企还是在这方面要选择外采,那么如何让供应商们听话,统筹好这一些,就要看车企们的本事了。

文章标签:
新能源
 
相关推荐
路咖汽车 33.4万粉丝    1.3万作品 关注 秉承专业态度,创作有趣的汽车内容,为用户提供有价值的参考信息
推荐作者
肆哥车讯 关注
购车无小事,选车无难事。
凤眼观车 关注
来一起快乐的撩车吧!
R视觉 关注
资深汽车摄影师、喜欢用视觉的角度来诠释一台车的魅力。
阿飞频率 关注
喜欢车爱聊车,喜欢把自己的爱好跟大家分享。
晓生说车 关注
晓生说车,与你一起畅聊汽车!
大付撕车 关注
大付撕车是汽车视频类栏目。栏目主张正确的选车观,为重度选车纠
车瘾AA 关注
聊聊车,说干货,不以老师自称,不以车评人自居,只是几个有车瘾
旅行体质 关注
我将持续更新我近几年在全世界各地旅行的见闻,有视频有图文!
全部爱咖号