/ 导读 /
定位在自动驾驶中占据着不可替代的地位,而且未来有着可期的发展。目前自动驾驶中的定位都是依赖RTK配合高精地图,这给自动驾驶的落地增加了不少成本与难度。试想一下人类开车,并非需要知道自己的全局高精定位及周围的详细环境,有一条全局导航路径并配合车辆在该路径上的位置,也就足够了,而这里牵涉到的,便是SLAM领域的关键技术。
什么是SLAM
SLAM (Simultaneous Localization and Mapping),也称为CML (Concurrent Mapping and Localization),即时定位与地图构建,或并发建图与定位。问题可以描述为:将一个机器人放入未知环境中的未知位置,是否有办法让机器人一边逐步描绘出此环境完全的地图,同时一边决定机器人应该往哪个方向行进。例如扫地机器人就是一个很典型的SLAM问题,所谓完全的地图(a consistent map)是指不受障碍行进到房间可进入的每个角落。
SLAM最早由Smith、Self和Cheeseman于1988年提出。由于其重要的理论与应用价值,被很多学者认为是实现真正全自主移动机器人的关键。
模拟人类来到一个陌生的环境时,为了迅速熟悉环境并完成自己的任务(比如找饭馆,找旅馆),这时应当依次做以下事情:
a.用眼睛观察周围地标如建筑、大树、花坛等,并记住他们的特征(特征提取)
b.在自己的脑海中,根据双目获得的信息,把特征地标在三维地图中重建出来(三维重建)
c.当自己在行走时,不断获取新的特征地标,并且校正自己头脑中的地图模型(bundle adjustment or EKF)
d.根据自己前一段时间行走获得的特征地标,确定自己的位置(trajectory)
e.当无意中走了很长一段路的时候,和脑海中的以往地标进行匹配,看一看是否走回了原路(loop-closure detection)。实际这一步可有可无。
以上五步是同时进行的,因此是Simultaneous Localization and Mapping。
激光SLAM与视觉SLAM
目前用在SLAM上的传感器主要分两大类,激光雷达和摄像头。激光雷达有单线多线之分,角分辨率及精度也各有千秋。
而VSLAM则主要用摄像头来实现,摄像头品种繁多,主要分为单目、双目、单目结构光、双目结构光、ToF几大类。他们的核心都是获取RGB和depth map(深度信息)。
由于受制成本的影响,视觉SLAM在近些年变得越来越流行,通过低成本的摄像头进行实时的建图与定位,这里面的技术难度也是非常之大。以ToF(Time of Flight),一种很有前景的深度获取方法为例。传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息。类似于雷达,或者想象一下蝙蝠,softkinetic的DS325采用的就是ToF方案(TI设计的)。但是它的接收器微观结构比较特殊,有2个或者更多快门,测ps级别的时间差,但它的单位像素尺寸通常在100um的尺寸,所以目前分辨率不高。
在有了深度图之后呢,SLAM算法就开始工作了,由于Sensor和需求的不同,SLAM的呈现形式略有差异。大致可以分为激光SLAM(也分2D和3D)和视觉SLAM(也分Sparse、semiDense、Dense),但其主要思路大同小异。
SLAM算法实现的要素
SLAM技术非常实用,同时难度也相当大,在时刻需要精确定位的自动驾驶领域,想要完成SLAM落地也是困难重重。一般来说,SLAM算法在实现的时候主要考虑以下4个方面:
1、地图表示问题,比如dense和sparse都是它的不同表达方式,这个需要根据实际场景需求去抉择
2、信息感知问题,需要考虑如何全面的感知这个环境,RGBD摄像头FOV通常比较小,但激光雷达比较大
3、数据关联问题,不同的sensor的数据类型、时间戳、坐标系表达方式各有不同,需要统一处理
4、定位与构图问题,就是指怎么实现位姿估计和建模,这里面涉及到很多数学问题,物理模型建立,状态估计和优化
其他的还有回环检测问题,探索问题(exploration),以及绑架问题(kidnapping)。
目前比较流行的视觉SLAM框架主要包含前端和后端:
前端
前端相当于VO(视觉里程计),研究帧与帧之间变换关系。
首先提取每帧图像特征点,利用相邻帧图像,进行特征点匹配,然后利用RANSAC去除大噪声,然后进行匹配,得到一个pose信息(位置和姿态),同时可以利用IMU(Inertial measurement unit惯性测量单元)提供的姿态信息进行滤波融合后端则主要是对前端出结果进行优化,利用滤波理论(EKF、UKF、PF)、或者优化理论TORO、G2O进行树或者图的优化。最终得到最优的位姿估计。
后端
后端这边难点比较多,涉及到的数学知识也比较多,总的来说大家已经慢慢抛弃传统的滤波理论走向图优化去了。
因为基于滤波的理论,滤波器稳度增长太快,这对于需要频繁求逆的EKF(扩展卡尔曼滤波器),PF压力很大。
而基于图的SLAM,通常以keyframe(关键帧)为基础,建立多个节点和节点之间的相对变换关系,比如仿射变换矩阵,并不断地进行关键节点的维护,保证图的容量,在保证精度的同时,降低了计算量。
SLAM未来在自动驾驶领域的应用
Slam技术目前已经在多个领域都取得了不错的落地效果与成绩,包括室内的移动机器人,AR场景以及无人机等等。而在自动驾驶领域,SLAM技术却一直未得到太多的重视,一方面由于定位在目前的自动驾驶行业中大多通过RTK来解决,并不会投入过多的资源去进行深入的研究,另一方面也是由于目前技术还不成熟,在自动驾驶这种关乎生命的领域,任何一种新技术都得经过时间的检验才能被接受。
在未来,随着传感器精度的逐渐提升,SLAM也会在自动驾驶领域大显身手,其成本的低昂性,性能的鲁棒性,都将为自动驾驶带来革命性的变化。而随着SLAM技术的逐渐火热,也将有越来越多的定位人才涌进自动驾驶领域,为自动驾驶注入新鲜血液,带来新的技术方向与研究领域。更多资讯,请关注智车科技公众号!
参考资料:
[1] https://blog.csdn.net/u010632165/article/details/119426739
OMEN暗影精灵 11 游戏笔记本(后简称暗影精灵11)可以说是近期关注度比较高的游戏本,硬件规格主流,性能释放不低,关键是价格太香了,国补后RTX 5060版本最低也就6000多一点,RTX 5070版本国补后最低甚至低于7000元,性价比放在一线品牌中十分突出。今天我拿到了暗......
容声冰箱携“寻鲜之旅”养鲜答卷鲜耀南博会!
日前,多个招聘平台的招聘信息显示,潮玩巨头泡泡玛特正在招募小家电研发工程师、工业设计师等专业人才,月薪在1.5万-2.5万元,岗位职责明确指向复古小冰箱、咖啡机、早餐机的开发流程,甚至要求十年以上家电行业经验。这家以盲盒玩偶风靡全球的企业,正在向一个看似毫不相干的领域伸出触角——......
日前,2025高通汽车技术与合作峰会在苏州盛大举行,此次峰会上,高通携手广大主机厂、供应商,展示了骁龙座舱平台至尊版、Snapdragon Ride平台至尊版等汽车平台,以及落地方案,展示了基于舱驾融合理念下的汽车智能新体验
全球高端电视市场的竞争格局,正迎来中韩巨头深度较量的关键时期。一边是以三星、LG为代表的韩国巨头,凭借深厚的显示技术底蕴和品牌积淀强势布局;另一边则是以TCL、海信为首的中国军团,以极具性价比的创新技术与灵活策略发起冲击。这场交锋的核心焦点,已鲜明地聚焦于新型显示技术路线的争夺:......
颠覆传统豪华:阿维塔06带来的不只是变革
挂耳式耳机什么牌子好?怎么选?开放式耳机测评推荐
日前,2025高通汽车技术与合作峰会在苏州盛大举行,现场,除了有高通汽车平台硬核展示之外,还云集了汽车领域的诸多大佬,留下了不少精彩瞬间
华为智驾灵魂人物空降,吉利迎来iPhone时刻
在生物柴油上涨的推动下,相关上市公司业绩表现随之修复。
当方盒子遇见摇滚灵魂,iCAR V23以先锋态度助燃苏见信「尽兴而活」成都巡演
智能驾驶当下的发展方向,一个是从L2级别辅助驾驶向L3级别自动驾驶迈进,另一个就是实现算力硬件的自研,比如说小鹏即将在G7上首发上车的自研图灵AI芯片。哪怕是财务状况一直紧张的蔚来,也在不遗余力推动自研神玑NX9031芯片的发展。
“一家在海外市场已经很有知名度的中国电视品牌,利用其现有渠道转做空调,但其净利润率仅为3%。”2025年6月底,深圳“中国企业出海高峰论坛”上,格力电器市场总监朱磊的发言引发关注。
罗姆宣布,与领先的车规芯片企业芯驰科技面向智能座舱联合开发出参考设计“REF68003”。
不知道大家茶余饭后有什么兴趣爱好?机车?钓鱼还是拍照? 对我来说,每天下班之后玩几轮单机游戏,例如《NBA 2K25》、《黑神话·悟空》等等,对于不抽烟、不喝酒的中年男人来说,可以说是为数不多的乐趣。 既然是单机游戏,那就离不开“游戏手柄”,从少年的红白机到如今的Switch......
强到没朋友,指纹加密+100W快充,这款至高8T硬盘盒颠覆我的体验
在新能源汽车技术的激烈角逐中,“打死不做增程” 的呼声背后,是对更优技术方案的探寻。长城汽车的 Hi4 技术应运而生,以破局者之姿,重新定义混动四驱新标准,尤其是在与增程技术的对比中,优势尽显。
比亚迪前段时间兆瓦闪充技术的推出赚足了眼球,很多车企看到后随之发布了自己的高压技术平台,可以看到,比亚迪的确在引领行业发展,但是兆瓦闪充我们目前能够看到哪些瓶颈呢?
森萨塔的 SIM200 绝缘监测设备可检测高压电气系统(如EV充电)中的潜在隔离故障以帮助确保系统安全运行
中国车企自动驾驶正经历量产普及、技术跨越、生态输出的三阶跃迁,2025年也将是针对L3级自动驾驶量产的爆发元年,中国车企需把握数据主权与技术普惠双轮驱动,构建全球智能汽车新秩序。我们在家“坐等”新车上门的时代,也许就在不远的未来。