基于卷积神经网络和卡尔曼滤波的道路损伤识别方法与流程

文档序号:17470115发布日期:2019-04-20 05:46阅读:840来源:国知局

本发明属于图像处理技术领域,具体涉及一种基于卷积神经网络和卡尔曼滤波的道路损伤识别方法。



背景技术:

道路损坏出现裂缝是当今道路养护面临的主要问题,众多损坏道路的修复是一项巨大的工程。修复之前,养路工人需要对路面情况进行调研,此项工程需要耗费巨大的人力、物力和财力。随着高科技的发展,科学家想到了一种简便的方法,用精密的拍照仪器安放在汽车前段,可以在短时间内得到大量的有用图片,再经过筛选,截取出有用的道路损坏图像。

将采集到的道路损伤图像分为8类,分类情况如下:d00表示直线裂缝有纵向车轮标记部分、d01表示施工缝部分、d10表示等间隔线部分、d11表示横向施工缝部分、d20表示龟裂缝有部分路面和整体路面、d40表示凹陷坑洞分离、d43表示白线的模糊和d44表示人行横道线的模糊。

深度神经网络是人工智能应用的基础,在很多方面都有用到,例如在语音识别、图像识别和无人驾驶汽车等方面。在许多领域中,目前深度学习卷积神经网络的准确性已经超过人类。与早期的专家手动提取特征或制定规则不同,深度学习卷积神经网络的优越性能来自于在大量数据上使用统计学习方法,从原始数据中提取高级特征的能力,从而对输入空间进行有效的表示。但深度学习卷积神经网络超高的分类准确性是以超高的计算复杂度为代价的。



技术实现要素:

本发明的目的在于提供用于一种基于卷积神经网络和卡尔曼滤波的道路损伤识别方法。

本发明的具体步骤如下:

步骤1、对n张含有道路损伤的损伤图进行排序。第i张损伤图的分辨率为vi×hi,vi为第i张损伤图上一行像素的个数;hi为第i张损伤图上一列像素的个数,i=1,2,…,n;第i张损伤图的损伤类别为zi。

步骤2、图像增强与卷积神经网络的训练。

2.1、i=1,2,…,n,依次执行步骤2.2至2.4。

2.2、将步骤1所得第i张损伤图放大ti倍。

若hi>vi,则ti=300/hi,并将第i张损伤图的左列像素以第i张损伤图的左侧边缘作为对称轴进行镜像对称,并将第i张损伤图的右行像素以第i张损伤图的右侧边缘作为对称轴进行镜像对称,得到分辨率为300×300的第i张一级扩展图。

若hi≤vi,则t=300/vi,并将第i张损伤图的上行像素以第i张损伤图的上侧边缘作为对称轴进行镜像对称,并将第i张损伤图的下行像素以第i张损伤图的下侧边缘作为对称轴进行镜像对称,得到分辨率为300×300的第i张一级扩展图。

2.3、将步骤2.2所得的第i张一级扩展图放大1.5倍,得到分辨率为450×450的第i张二级扩展图;将第i张一级扩展图放大2倍,得到分辨率为600×600的第i张三级扩展图。

2.4、用步骤2.2所得的第i张一级扩展图复制出第i张四级扩展图、第i张五级扩展图、第i张六级扩展图、第i张七级扩展图;并将第i张四级扩展图、第i张五级扩展图、第i张六级扩展图、第i张七级扩展图分别调整为0.8倍、0.9倍、1.1倍和1.2倍。

2.5、将第i张一级扩展图、第i张二级扩展图、第i张三级扩展图、第i张四级扩展图、第i张五级扩展图、第i张六级扩展图和第i张七级扩展图导入卷积神经网络进行训练。

步骤3、k=1,2,…,m,依次执行步骤4至6。m为被测图像的数量。

步骤4、将分辨率为v′k×h′k的第k张被测图像放大t′k倍。若h′k<v′k,则t′k=300/v′k,并将被测图像的左列像素以被测图像的左侧边缘作为对称轴进行镜像对称,并将被测图像的右行像素以被测图像的右侧边缘作为对称轴进行镜像对称,得到分辨率为300×300的第k张被测扩展图像。

步骤5、将步骤4所得的第k张被测扩展图像输入步骤2训练所得的卷积神经网络中。卷积神经网络输出中获取被测图片的特征信息矩阵hk和权重矩阵wk。

步骤6、将步骤5所得的权重初始值wk通过卡尔曼滤波算法进行优化。

6.1、计算权重预测值的表达式如式(1)所示:

式(1)中,i为两行两列的单位矩阵。

6.2、计算权重预测值的协方差矩阵pk′如式(2)所示:

p′k=i′·pk·i′t+q(2)

式(2)中,q为过程噪声,其值为0.00003;i′t为单位矩阵i′的转置。i′为c行c列的单位矩阵;pk为c行c列,且主对角线上所有元素均为0.001,其余元素均为零的矩阵。c为全连接层输出节点个数。

6.3、计算第k个最优增益阵kk如式(3)所示:

式(3)中,为矩阵hk的转置;r为观测噪声,其值为0.005。

6.4、计算第k个权重更新矩阵w′k如式(4)所示:

式(4)中,r为观测噪声,其值为0.005;

步骤七、根据第k个权重更新矩阵w′k计算m矩阵式(5)所示;

m=[hk·w′k]t(5)

式(5)中,[hk·w′k]t为矩阵[hk·w′k]的转置。

步骤七、找到m矩阵内所有元素中的最大值。m矩阵内所有元素中的最大值对应的行数即为被测图像中道路损伤的类别号。

进一步地,所述的卷积神经网络采用vgg16。

进一步地,步骤5执行后,对权重矩阵wk通过主成分分析算法进行降维。

进一步地,所述的全连接层输出节点个数c等于4096。

本发明具有的有益效果是:

1、本发明采用前馈运算、随机梯度下降法、反馈运算、pca降维和卡尔曼滤波等方法进行实时的参数更新,通过尽可能少的训练图片,建立高准确率的卷积神经网络模型。

2、本发明通过引入pca降维算法,降低了图像特征信息和权重的维度,减少了了计算量和识别时间。

3、本发明通过卡尔曼滤波算法来实时更新参数,进而以提高识别的准确率。

具体实施方式

以下对本发明作进一步说明。

基于卷积神经网络和卡尔曼滤波的道路损伤识别方法,具体步骤如下:

步骤1、图像预处理。

对n张含有道路损伤的损伤图进行排序。第i张损伤图的分辨率为vi×hi,vi为第i张损伤图一行像素的个数;hi为第i张损伤图一列像素的个数,i=1,2,…,n;第i张损伤图的损伤类别为zi。

步骤2、图像增强与卷积神经网络的训练。

2.1、i=1,2,…,n,依次执行步骤2.2至2.4。

2.2、将步骤1所得第i张损伤图放大ti倍。若hi>vi,则ti=300/hi,并将第i张损伤图的左列像素以第i张损伤图的左侧边缘作为对称轴进行镜像对称,并将第i张损伤图的右行像素以第i张损伤图的右侧边缘作为对称轴进行镜像对称,得到分辨率为300×300的第i张一级扩展图;若hi≤vi,则t=300/vi,并将第i张损伤图的上行像素以第i张损伤图的上侧边缘作为对称轴进行镜像对称,并将第i张损伤图的下行像素以第i张损伤图的下侧边缘作为对称轴进行镜像对称,得到分辨率为300×300的第i张一级扩展图。

2.3、将步骤2.2所得的第i张一级扩展图放大1.5倍,得到分辨率为450×450的第i张二级扩展图;将第i张一级扩展图放大2倍,得到分辨率为600×600的第i张三级扩展图。

2.4、将步骤2.2所得的第i张一级扩展图复制出第i张四级扩展图、第i张五级扩展图、第i张六级扩展图、第i张七级扩展图;并将第i张四级扩展图、第i张五级扩展图、第i张六级扩展图、第i张七级扩展图分别调整为0.8倍、0.9倍、1.1倍和1.2倍。

2.5、将第i张一级扩展图、第i张二级扩展图、第i张三级扩展图、第i张四级扩展图、第i张五级扩展图、第i张六级扩展图和第i张七级扩展图导入卷积神经网络进行训练,使得卷积神经网络了解损伤类别为zi的道路损伤的形状。卷积神经网络采用vgg16。

步骤3、k=1,2,…,m,依次执行步骤4至6。m为被测图像的数量。

步骤4、将分辨率为v′k×h′k的第k张被测图像放大t′k倍。若h′k<v′k,则t′k=300/v′k,并将被测图像的左列像素以被测图像的左侧边缘作为对称轴进行镜像对称,并将被测图像的右行像素以被测图像的右侧边缘作为对称轴进行镜像对称,得到分辨率为300×300的第k张被测扩展图像。

步骤5、将步骤4所得的第k张被测扩展图像输入步骤2训练所得的卷积神经网络中。卷积神经网络输出中获取被测图片的特征信息矩阵hk、权重矩阵wk和偏置bk。对权重矩阵wk通过主成分分析算法(pca方法)进行降维。

步骤6、将步骤5所得的权重初始值wk通过卡尔曼滤波算法进行优化。

6.1、根据wk计算权重预测值的表达式如式(1)所示:

式(1)中,i为两行两列的单位矩阵。

6.2、计算权重预测值的协方差矩阵pk′如式(2)所示:

pk′=i′·pk·i′t+q(2)

式(2)中,q为过程噪声,其值为0.00003;i′t为单位矩阵i′的转置。i′为c行c列的单位矩阵;pk=diag(0.001,0.001,…0.001)c·c,即pk是c行c列,且主对角线(左上角到右下角的对角线)上所有元素均为0.001,其余元素均为零的矩阵(方阵)。c为全连接层输出节点个数,其值为4096。

6.3、计算第k个最优增益阵kk如式(3)所示:

式(3)中,为矩阵hk的转置;r为观测噪声,其值为0.005;hk在步骤5中已获取。

6.4、计算第k个权重更新矩阵w′k如式(4)所示:

式(4)中,r为观测噪声,其值为0.005;

步骤七、根据第k个权重更新矩阵w′k计算m矩阵式(5)所示;

m=[hk·w′k]t(5)

式(5)中,[hk·w′k]t为矩阵[hk·w′k]的转置。m矩阵为8行k列的矩阵。

步骤七、找到m矩阵内所有元素中的最大值。m矩阵内所有元素中的最大值对应的行数即为被测图像中道路损伤的类别号(即1至8行分别对应d00、d01、d10、d11、d20、d40、d43、d44)。

通过将一个道路损伤图库中多张图片按照步骤二中的方法进行镜像变换、多尺度处理、光照漂移得到不同尺寸、不同亮度的多组道路损伤图片。并用所得的多组道路损伤图片分别用本发明进行道路损伤类别号的判断,结果显示,本发明对多尺度多光照的多组道路损伤图片的判断平均准确率为99.22%;而采用常规的道路损伤图像识别方法时,对多尺度多光照的多组道路损伤图片的判断平均准确率为90.09%。

可见,本发明对于不同亮度、不同尺寸的被测图像,均具有高于现有道路损伤图像识别方法的准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1