基于改进SoftMax损失函数的图像相似度计算方法与流程

文档序号：16211570发布日期：2018-12-08 07:48阅读：1926来源：国知局

本发明属于深度神经网络提取图像特征的深度学习领域，涉及到神经网络、模式识别等技术，尤其涉及到一种基于改进型soft-max损失函数的图像相似度计算方法。

背景技术

图像识别技术是现今人工智能以及模式识别的研究热点，是一种根据观测到的图像对其中的物体进行类别鉴别的生物识别技术。它在航空航天、医学、工业自动化、机器人、及军事等领域都有广泛的应用。

随着科技的发展，图像识别的应用范围不断扩大，逐渐从公安刑侦领域，推广到工业邻域，如做激光定位切割、定位打标、定位焊接时非常需要图像识别技术的帮助、自动化生产线物品的分类等，也被广泛应用于安防领域。这些应用是用在现实场景过程中所以对于识别准确率有较高要求，但是现代图像识别技术的一个不足就是识别准确率比较低，现实场景中的图像识别效果及准确率明显偏低，在实时场景中的图像常常受到光照、遮挡等影响，造成图像噪声过大，对于抓拍到的图像存在识别准确率比较低的问题。

解决上述问题的关键就是要克服图像识别准确率的问题，本发明根据深度神经网络和改进型soft-max损失函数训练图像识别模型，提高现实场景下图像识别准确率。目前,深度学习由于其强大的表征能力,提取的特征相比传统方法手工构造的特征具有更强的鲁棒性,因此被广泛应用于图像识别中。用深度学神经网络和传统的soft-max损失函数训练的图像识别模型比传统方法训练的模型在识别准确率上要高很多，但是识别准确率还是有待提高。所以要实现高识别准确率的图像识别要通过更有效的解决方法。

技术实现要素：

本发明克服了现有技术的不足之处，提出了一种基于改进型soft-max损失函数的图像相似度计算方法，意在利用改进型soft-max损失函数训练出高识别准确率的图像识别模型，提高现实场景中图像识别过程的图像分类正确性。

本发明为达上述发明目的，采用如下技术方案：

一种基于改进型soft-max损失函数的图像相似度计算方法，其步骤包括：

步骤(1)：准备图像识别训练数据集和，将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练，所述基于卷积神经网络的图像识别网络中包含卷积层，最大采样层，全连接层，改进型soft-max层四种网络层，其中，一个卷积层与一个最大采样层构成一个图像识别子结构，图像识别网络包含n个串联的子结构，图像识别网络的最后三层分别为图像特征层、图像分类层和改进型soft-max层，所述图像特征层和图像分类层分别为输出维度是c维和d维的全连接层，c表示图像特征数，d表示图像类别数，改进型soft-max层激活函数为：

其中，σ(xi)表示在图像识别网络中的改进型soft-max层对第i个样本属于正确类别的预测概率值，xi∈r^d表示第i个样本在图像识别网络中的图像特征层的输出值，yi表示第i个样本的图像类别标签，wj表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n表示总训练样本的类别数，m表示决策边缘，由网络训练得到。

步骤(2)：选用改进型soft-max损失函数来进行图像识别网络的反向传播更新网络权值，训练得到一个图像识别的模型，所述改进型soft-max损失函数计算公式为：

进一步地，图像识别网络中的图像特征层和图像分类层之间的反向传播求导公式为：

第i个样本的损失函数对决策边缘m求偏导的公式为：

第i个样本的损失函数对权重wyi求偏导的公式为：

第i个样本的损失函数对偏置项bi求偏导的公式为：

第i个样本的损失函数对权重wj求偏导的公式为：

其中，li表示第i个样本的损失值，xi∈r^d表示第i个样本在图像识别网络中的图像特征层的输出值，yi表示第i个样本的图像类别标签，wj表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n表示总训练样本的类别数，λ表示权重系数，m表示决策边缘，由网络训练得到。

步骤(3)：将两张待测试的图像p1和p2利用步骤(2)中得到的图像识别模型进行图像特征的提取，分别得到图像特征向量pf1和pf2，通过计算得到pf1和pf2之间的余弦相似度pc,设置图像相似度阈值为pt，如果pc≥pt，则判定图像p1和p2是同一类图像，如果pc＜pt，则判定图像p1和p2不是同一类图像，所述图像特征为步骤(1)中的图像特征层的输出。

与现有技术相比，本发明的有益效果体现在：

本发明采取改进型soft-max损失函数的图像相似度计算方法，采用基于深度学习的图像识别网络提取图像特征，使得提取到的特征具有更强的图像特征表达能力，能够有效避免传统手工方法提取的特征由于表征能力不足造成的图像识别准确率不高的问题，图像识别网络中的改进型soft-max层的激活函数采用改进型soft-max激活函数，反向传播过程中采用改进型soft-max损失函数更新网络权值，使得图像特征具有更大的类间距离和更小的类内距离，训练得到图像识别模型；在测试阶段用训练好的图像识别模型对两张测试图像提取特征向量，计算得到特征向量之间的余弦相似度，和设置的图像相似度阈值比较，如果大于等于图像相似度阈值则判定两张图像为同一类图像，如果小于图像相似度阈值则判定两张图像为不同类图像；本发明适用于图像识别，能够克服采用基于深度学习的图像识别网络和传统soft-max损失函数训练的图像识别模型计算图像相似度存在的识别不准确问题，提高图像识别的准确性。

附图说明

图1是图像识别网络结构示意图。

具体实施方式

下面结合附图对本发明作进一步说明。

如图1所示为图像识别网络结构示意图，本发明的基于改进型soft-max损失函数的图像相似度计算方法主要包括如下步骤：

步骤(1)：准备图像识别训练数据集，训练数据集为开源的图像识别数据库imagenet2012,包括1000个类别的1百多万张图像，将图像识别训练数据集输入到基于卷积神经网络的图像识别网络中开始训练，所述基于卷积神经网络的图像识别网络中包含卷积层，最大采样层，全连接层，改进型soft-max层四种网络层，其中，一个卷积层与一个最大采样层构成一个图像识别子结构，图像识别网络包含n＝34个串联的子结构，图像识别网络的最后三层分别为图像特征层、图像分类层和改进型soft-max层，所述图像特征层和图像分类层分别为输出维度是512维和1000维的全连接层，512表示图像特征数，1000表示图像类别数，改进型soft-max层激活函数为：

其中，σ(xi)表示在图像识别网络中改进型soft-max层对第i个样本属于正确类别的预测概率值，xi∈r^d表示第i个样本在图像识别网络中的图像特征层的输出值，yi表示第i个样本的图像类别标签，wj表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n＝1000表示总训练样本的类别数，m表示决策边缘，由网络训练得到。

进一步地，图像识别网络中的图像特征层和图像分类层之间的反向传播求导公式为：

第i个样本的损失函数对决策边缘m求偏导的公式为：

第i个样本的损失函数对权重wyi求偏导的公式为：

第i个样本的损失函数对偏置项bi求偏导的公式为：

第i个样本的损失函数对权重wj求偏导的公式为：

其中，li表示第i个样本的损失值，xi∈r^d表示第i个样本在图像识别网络中的图像特征层的输出值，yi表示第i个样本的图像类别标签，wj表示图像特征层与图像分类层之间的权重的第j列，b表示偏置项,n＝1000表示总训练样本的类别数，λ表示权重系数，取λ＝0.5，m表示决策边缘，由网络训练得到。

步骤(3)：将两张待测试的图像p1和p2利用步骤(2)中得到的图像识别模型进行图像特征的提取，分别得到图像特征向量pf1和pf2，通过计算得到pf1和pf2之间的余弦相似度pc,设置图像相似度阈值为pt＝0.8，如果pc≥0.8，则判定图像p1和p2是同一类图像，如果pc＜0.8，则判定图像p1和p2不是同一类图像，所述图像特征为步骤(1)中的图像特征层的输出。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：章东平;李建超
技术所有人：中国计量大学
我是此专利的发明人

上一篇：一种不间断电源用除尘装置的制作方法
上一篇：洗衣机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。