一种基于图像特征降维的无人车单目视觉定位方法与流程

文档序号:11201354阅读:534来源:国知局
一种基于图像特征降维的无人车单目视觉定位方法与流程
本发明涉及无人车定位领域,尤其是涉及一种基于图像特征降维的无人车单目视觉定位方法。
背景技术
:在变化多样的环境中,包括光线变化、天气变化、物体移动、季节更替等等造成的场景变化,机器人能否准确定位是实现机器人真正智能化的基本和核心问题。机器人定位常用传感器包括:gps、里程计、雷达、双目相机,但却各存弊端。与深度学习相结合的单目视觉使用范围广、定位精度高、抗干扰能力强、没有双目标定带来的繁琐,是目前广受欢迎的定位方法。但目前的单目视觉当定位场景变化时鲁棒性较差、数据量大、运算速度较慢。技术实现要素:本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种传感器成本低且适用范围广、鲁棒性强、运算速度更快、误定位概率降低的基于图像特征降维的无人车单目视觉定位方法。本发明的目的可以通过以下技术方案来实现:一种基于图像特征降维的无人车单目视觉定位方法,包括以下步骤:1)通过深度卷积神经网络dcnn对所有的输入图像进行全局特征描述,并且提取第三卷积层作为图像特征向量;2)采用主成分分析算法将所有的图像特征向量进行降维,得到降维后的图像特征向量以及可重复使用的降维矩阵;3)根据降维后的图像特征向量生成匹配矩阵,并消除匹配矩阵中的干扰,根据匹配矩阵获取相匹配的地图图像和需要定位的图像进行定位。所述的步骤1)中,采用tensorflow框架中的alexnet网络进行全局特征描述,并提取第三卷积层作为图像特征向量。所述的步骤2)具体包括以下步骤:21)设定图像特征向量的保留维度a;22)将所有输入图像对应的图像特征向量随机分为降维组a和测试组b两组;23)对降维组a中的全部图像特征向量进行pca降维到a维,得到降维矩阵p,测试组b的图像特征向量乘以矩阵p完成对b集的图像特征降维;24)将降维组a作为地图图像,将测试组b作为测试图像,通过定位算法对测试组b中的图像进行定位,并获取定位精度;25)重复步骤23)-24),获取定位精度最高时对应的降维矩阵,完成图像特征向量进行降维。所述的步骤21)中,选取的保留维度a的维数使得对应的信息涵盖率超过90%。以6288张640*480图像为例,图像特征维度与信息涵盖率的关系如下表所示。图像特征维度信息涵盖率图像特征维度信息涵盖率31699%6294%18798%5193%13697%4492%9996%3891%7695%3390%所述的降维组a占有70%的图像特征向量数和测试组b占有30%的图像特征向量数。所述的步骤24)中,定位算法为seqslam、orbslam、lsdslam或fabmap2.0算法。与现有技术相比,本发明具有以下优点:一、传感器成本低且适用范围广:本发明采用简单易得的普通摄像头,只要能够获取清晰图像就可以通过深度卷及神经网络dcnn提取特征,再加以后期数据处理,就可以达到在变化较大的场景中定位目的。二、鲁棒性强:在进行pca降维时,按照7:3的比例对图像特征集随机分配,保障鲁棒性,对70%的图像特征进行降维,利用30%的图像特征进行定位测试,比较定位精度,选用保留维度较低精度较高的图像特征维度,确保维度降低不会影响定位。三、运算速度更快:通过训练得到一个能够表达稳定场景的定位不失真的稳定的pca模型,在实时定位时,imagenet网络提取的图像特征只要直接乘以该pca降维矩阵就可以得到数据量小的具有鲁棒性的图像特征向量。四、误定位概率降低:pca降维弱化了背景信息的干扰,如:天空、路面等。同时,对匹配矩阵进行了核化运算,将匹配较好和匹配较差的图像特征加大了差距。五、降维矩阵可重复使用:本发明中通过pca降维获得的最优的降维矩阵,即定位精度最高时对应的降维矩阵,可以重复使用,在需要进行降维的情况下,不必再次进行降维运算,只要直接运用该pca降维模型矩阵,执行矩阵的减法和乘法操作就可以得到数据量小的具有鲁棒性的图像特征向量,方便快快速准确。附图说明图1为本发明的方法流程图。具体实施方式下面结合附图和具体实施例对本发明进行详细说明。实施例如图1所示,本发明的流程为:1、对于输入图像,通过深度卷积神经网络dcnn进行全局特征描述,提取第三卷积层作为图像特征。对于输入图像,通过深度卷积神经网络dcnn进行全局特征描述。本方法采用tensorflow框架中的alexnet网络。该网络在2012年imagenet图像分类竞赛中赢得冠军,该网络结构5个卷基层,,以及3个全连接层,在每一个卷积层中包含了激励函数以及局部响应归一化处理,然后再经过池化处理。经实践证明,第三层卷积网络即cov3提取出的64896维特征鲁棒性最好,在环境变化较大时仍然可以识别出该场景。2、选取一部分(约70%)图像特征向量进行降维,剩余(约30%)图像特征向量进行检测,通过定位精度对比,找到保留维度尽可能少的最稳定的pca模型,从而得到降维矩阵。具体包括以下步骤:2.1确定pca保留维度通过列表对比,观察保留维度的降低数据涵盖率的减少规律,按照图像特征维度与信息涵盖率的关系,选择涵盖率尽可能高的较低的数据维度,假设最终每个图像特征保留维度为a。2.2降维训练利用随机函数将imagenet提取的图像特征分为两组——70%的降维集a,30%的测试集b。对a集进行pca降维,每个图像特征保留a维,得到降维矩阵p。b集的图像特征向量乘以p矩阵就直接对b集的图像特征降维。通过最成熟的定位算法对b集合图像位置定位,并计算定位精度。2.3确定pca降维模型多次随机分配70%和30%的图像集合,比如:图像共3000张,则使用随机函数生成2100个[1,3000]之间的随机数,对应图像列入70%图像集合,剩余图像列入30%集合,重复进行步骤2.2,通过比较得到的多个定位精度,取最高精度对应的pca模型的降维矩阵作为之后imagenet图像特征向量的降维矩阵。3、分别将需要定位的图像以及地图图像乘以降维矩阵进行降维。得到特征向量集合datasetvectors和queryvectors,这两个向量集合每两个向量之间做向量余弦运算,得到匹配矩阵matchingmatrix。对该矩阵做核化处理,通常采用膨胀和腐蚀增强图像特征对比,消除相似信息干扰,如天空、路面等。然后在匹配矩阵matchingmatrix中进行线性拟合,选取斜率不为0的直线作为最终拟合直线,并获取其方程表达式y=kx+b,x为需要定位的图像的位置,y为与测试图像匹配的地图图像的位置,找到对应的图像后即可采用常规方法进行定位。本发明采用深度卷积神经网络dcnn进行特征提取,对第三个卷积层的64896维向量采用主成分分析降维。每次从图像特征中选取一部分相同数量的特征向量,其余特征向量作为测试集,直到得到能够保持图像稳定性,定位不失真的稳定的pca模型,在实时定位时,经过imagenet网络提取的图像特征只要直接乘以该pca降维矩阵就可以得到数据量小的具有鲁棒性的图像特征向量。1、从传感器选用相比:传统方法的传感器大多是gps、激光、双目相机等,但却弊端突出:gps在遮挡严重区域无法用,如地下、深海、被高建筑遮挡区域等;激光则价格昂贵且体积较大;双目相机需要预先标定,不仅繁琐而且容易影响定位精度。本发明采用一个普通的摄像头通过深度特征提取以及数据后期处理,就可以达到定位目的。2、与其他单目摄像头定位算法相比:seqslam算法、fabmap算法针对出现光线变化、天气变化、物体移动、季节更替等情况时定位不准,鲁棒性较差;其他通过深度卷积神经网络提取特征的算法虽然鲁棒性提高了但是运算数据量大,运算速度慢。3、其他方法没有对数据降维这一步,本方法不仅通过降维减少了数据量,而且通过训练得到了一个能够稳定表达图像特征的pca降维矩阵,在实时定位时,imagenet网络提取的图像特征只要直接乘以该pca降维矩阵就可以得到数据量小的具有鲁棒性的图像特征向量。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1