一种基于图像全局特征主成分线性回归的室内视觉定位方法与流程

文档序号:13513452阅读:443来源:国知局
一种基于图像全局特征主成分线性回归的室内视觉定位方法与流程

本发明涉及室内定位和图像处理技术领域,具体涉及室内视觉定位方法。



背景技术:

在视觉定位领域,视觉定位需要利用丰富的图像信息来完成定位工作,任一类视觉室内定位方法在线阶段的图像匹配算法都存在大量的对比运算,导致整个定位阶段的耗时较长,采用了两级匹配思路的匹配算法,在粗略匹配阶段并没有考虑匹配的精度范围,而是过多的追求匹配速度,从而会导致精确定位阶段出现较大的定位误差。传统的定位算法效率与离线阶段采样数据的规模成正比例关系,因此传统的算法对离线阶段生成的数据库要求较高。需要额外设计相应的算法去控制离线数据库的容量以及质量。

典型的一种粗略匹配阶段的算法为分簇算法,即把具有相似特征的图像划分为一簇,因此根据需要定位场景的关键特征或者定位精度的需要,把视频数据库图像划分为若干簇,在每一簇中选取一张具有代表性的图像,使用其特征向量作为该簇的特征向量描述。当用户输入待定位图像时,计算该图像的特征向量与每一簇的代表特征向量的欧几里得距离,并根据欧几里得距离由小到大排序,将距离最小的簇代表作为输出,继续进行精确定位。理论分析得出该种类的定位算法,定位的精度与速度成反比,其中定位精度与分簇的数目成正比,定位的速度与分簇的数目成反比,因此该种类算法只能根据实际需要,在定位精度与定位速度之间进行均衡。

为了改进传统算法的弊端,本发明采用一种新的算法,既提高了定位精度又可以加快定位的速度,同时算法的输出可以作为一维定位要求小于2m误差的场景的最终定位结果,不需要在进行精确定位。



技术实现要素:

本发明的目的是为了解决传统算法在初始阶段匹配精度较差、耗时不恒定以及对离线数据库要求较高的问题,而提出一种基于图像全局特征主成分线性回归的室内视觉定位方法。

一种基于图像全局特征主成分线性回归(pclr-gist)的室内视觉定位方法包括以下步骤:

步骤一:使用图像全局特征算法对视频数据库图像进行特征信息提取,得到特征信息样本矩阵;

步骤二:对步骤一提取的特征信息使用主成分分析算法,提取数据库图像特征信息的主成分;

步骤三:对步骤二提取的数据库图像特征信息的主成分使用线性回归算法,将视频帧对应的位置信息与步骤一提取的特征信息映射,生成定位模型;

步骤四:使用gist算法对用户定位图像进行特征信息提取;

步骤五:将步骤四提取的特征信息输入步骤三生成的定位模型中,得到用户位置与待精度匹配的数据库视频帧。

本发明的有益效果为:

利用本发明方法进行室内视觉粗略定位时,所需时间更短、精度更高,在相同的定位场景下,本发明对于离线数据库没有任何的需求,而传统分簇算法需要根据场景选取特定帧作为簇的代表,选定时需要进行精确的测定,在同样采取粗略-精确匹配的情况下定位速度更快。在离线阶段采用gist算法、pca算法、lr算法生成定位模型,在线阶段根据用户定位图像gist特征,一步完成用户位置粗略估算与精确定位阶段所需参考数据库视频帧输出。

根据实验结果,本发明在同样的定位场景中,定位所需时间均值仅为0.25ms,而传统分簇算法消耗的时间均值为0.35ms,利用本发明进行定位时,所需时间较传统分簇算法减少30%左右,并且相对于传统分簇算法,本发明的定位精度也有较大的提高。本发明一维定位的平均误差为0.67m,最小定位误差0m,最大定位误差1.98m。本发明定位误差在1m内的置信概率接近80%,而传统的分簇算法只有60%。

附图说明

图1是本发明的流程图;

图2是视频数据库为1400张图像时分簇算法与本发明算法的消耗时间对比图;

图3是视频数据库为1200张图像时分簇算法与本发明算法的消耗时间对比图;

图4是视频数据库为800张图像时分簇算法与本发明算法的消耗时间对比图;

图5是视频数据库为600张图像时分簇算法与本发明算法的消耗时间对比图;

图6是分簇算法与本发明算法定位精度的对比图。

具体实施方式

具体实施方式一:如图1所示,一种基于图像全局特征主成分线性回归的室内视觉定位方法包括以下步骤:

步骤一:使用图像全局特征算法对视频数据库图像进行特征信息提取,得到特征信息样本矩阵;

步骤二:对步骤一提取的特征信息使用主成分分析算法,提取数据库图像特征信息的主成分;

步骤三:对步骤二提取的数据库图像特征信息的主成分使用线性回归算法,将视频帧对应的位置信息与步骤一提取的特征信息映射,生成定位模型;

步骤四:使用gist算法对用户定位图像进行特征信息提取(与步骤一方法相同);

步骤五:将步骤四提取的特征信息输入步骤三生成的定位模型中,得到用户位置与待精度匹配的数据库视频帧。

gist算法为图像全局特征算法。

具体实施方式二:本实施方式与具体实施方式一不同的是:所述步骤一中使用图像全局特征算法对视频数据库图像进行特征信息提取,得到特征信息样本矩阵的具体过程为:

步骤一一、对视频数据库图像进行预处理:

首先要对图像进行预处理,当原始输入图像不是正方形时(为长方形时),应当以图像两个长边中点的连线为对称轴,向对称轴两侧的长边分别截取等于图像短边像素数一半的像素,得到一个正方形的图像,舍弃其余部分;若原始图像为正方形则不进行截取处理;将正方形图像按比例缩放至256×256像素,并将图像转换成灰度图;

步骤一二、对步骤一一得到的灰度图进行盖伯(gabor)滤波:

对灰度图进行二维离散傅里叶变换,如式(1)所示,

其中i(x,y)是图像的灰度值分布,x代表时域的x轴坐标值,y代表时域的y轴坐标值fx为频率域x轴的频率变量,fy为频率域y轴的频率变量,h(x,y)是为了减少边缘效应引入的环形汉明窗函数,i(fx,fy)是灰度图像进行二维离散傅里叶变换之后的值,n为缩放后的像素值,j为虚数单位;

由式(2)进行gabor函数计算,

其中l为灰度图像的尺度,θi为l尺度下的各方向角度,θl为灰度图像尺度下的方向总数,θi=π(k-1)/θl,i为方向角的计数值,一般取16个方向,k=1,2,…,θl,σ2为高斯函数的方差,为中间变量,由式(3)计算得到:

将灰度图像的二维离散傅里叶变换结果i(fx,fy)与gabor函数进行乘积运算,再进行二维傅里叶反变换,得到灰度图像的滤波结果i′(x,y),如式(4)所示:

步骤一三、对灰度图像的滤波结果i′(x,y)进行图像全局特征的向量表达:

将滤波后的灰度图像按4×4的网格方块划分为16块,依次统计每块内的滤波结果在不同方向上的灰度直方图的值,用一个行向量g进行表示,向量g作为图像的全局特征描述子,即为特征信息;

向量g的维数r(g)由式(5)计算得到,

r(g)=n2σδ(5)

其中,n2表示划分网格数,σ为尺度层数,δ为各个尺度所对应的方向数;

对数据库中的m张图像,重复执行步骤一一至步骤一三,得到m个行向量gm,组成特征信息样本矩阵。

其它步骤及参数与具体实施方式一相同。

具体实施方式三:本实施方式与具体实施方式一或二不同的是:所述步骤二中对步骤一提取的特征信息使用主成分分析算法,提取数据库图像特征信息的主成分的具体过程为:

步骤二一、为屏蔽gist向量中数值较大数据对较小数据的影响,使用标准差方法对步骤一得到的特征信息样本矩阵中的数据进行归一化,经过归一化得到标准化的特征信息样本矩阵x;

x*为归一化后数据值,x为初始数据值,μ为初始数据均值,σ为初始数据标准差;

步骤二二、对标准化的特征信息样本矩阵x求相关矩阵r;

步骤二三、通过雅克比法求解相关矩阵r的特征值λ1,λ2,…λk与特征向量,并按照大小进行排序;

步骤二四、计算特征值的累积贡献率,根据门限值ψ给出满足式(6)的最小值w,作为选取特征值的个数,按照步骤二三中的特征值排序,选取前w个特征值,并由前w个对应的特征向量组成矩阵e;

步骤二五、根据式(7),得到数据库图像的主成分载荷矩阵l中的各元素;

ecb为矩阵e的第c行第b列元素,λc为选取的前w个特征值中的第c个;

步骤二六、根据式(8),得到特征信息的主成分z;

z=lx(8)。

其它步骤及参数与具体实施方式一或二相同。

具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:所述步骤三中对步骤二提取的数据库图像特征信息的主成分使用线性回归算法,将视频帧对应的位置信息与步骤一提取的特征信息映射,生成定位模型:

使用特征主成分信息z与视频帧号p映射,根据映射公式(9),并使用最小二乘算法进行线性回归建模得到映射系数b0,b1,…,bq:

p=b0z0+b1z1+…+bqzq(9)

其中z1,…,zq为第一至第q个主成分,z0为常数,取值为1。

其它步骤及参数与具体实施方式一至三之一相同。

具体实施方式五:本实施方式与具体实施方式一至四之一不同的是:所述步骤五中将步骤四提取的特征信息输入步骤三生成的定位模型中,得到用户位置与待精度匹配的数据库视频帧具体为:

根据式(8)与式(9),给出用户图片匹配帧号,并根据式(10),给出用户位置估计:

其中r为录制视频数据库的帧率,v为录制设备沿行进路径的直线速度,a为用户沿运动方向行进距离。

使用一个窗函数,对给出的视频帧号,按照向上和向下的方向,在给定的步长内,再获取几张匹配图片用于精确定位阶段的参考图片,也可根据平均值算法给出粗略定位位置,有利于更进一步提高粗略定位的精度。

其它步骤及参数与具体实施方式一至四之一相同。

具体实施方式六:本实施方式与具体实施方式一至五之一不同的是:所述步骤一三中σ取值为1,δ取值为32,n取值为4。

其它步骤及参数与具体实施方式一至五之一相同。

具体实施方式七:本实施方式与具体实施方式一至六之一不同的是:所述步骤二四ψ取值为0.96。

其它步骤及参数与具体实施方式一至六之一相同。

实施例一:

1、在哈尔滨工业大学科学院2a栋12层,使用视频采集设备,对定位区域进行视频采集。

2、将采集到的视频文件使用gist算法提取特征,使用pca算法提取gist特征主成分,使用lr算法将视频帧序号与gist特征主成分映射。

3、输入用户待定位图片,提取gist特征,通过定位模型给出预测位置与数据库匹配帧号。

4、在图2—图5所展示的是使用传统的分簇算法与本发明所提出的算法在各个不同的数据库视频帧取值样例下的时间消耗对比。

5、根据定位结果,得到本发明算法的误差累计概率曲线如图6所示。

本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1