一种同源图像确定方法及装置与流程

文档序号:20839432发布日期:2020-05-22 17:18阅读:380来源:国知局
一种同源图像确定方法及装置与流程

本发明涉及智能家电领域,具体而言,涉及一种同源图像确定方法及装置。



背景技术:

同源图片或同源图像是指在同一平台上有相同来源的图片或图像,例如一张图片传递到某一平台后,经过各种变换如旋转、放缩、剪切、明暗、滤波、模糊、遮挡等处理后再传播,那么这些图片就属于同源图片,以及如果对原图进行拍照之后得到的图片也都属于同源图片,但若是同一场景被不同的人拍照或绘画,则不属于同源图片。

互联网时代,大量的数据都是由用户自己根据需求产生的,一个数据源进入互联网之后,用户会根据自己的需求,对原始数据源进行处理,从而产生大量的新数据,例如,某网友在社交网站上传了一张图片,图片在传播过程中会经过不同用户的各种压缩、裁剪、修改格式、添加用户信息以及轻度ps(photoshop)等操作修改,从而产生大量的相似图片,加大了图片追踪的难度。基于此再做同源图像检索的时候,就无法应用简单的图片特征,如现有的md5等查找同源图片,只能采用基于内容的图片检索方法或基于语义特征的检索方法。

当前的同源图片确定技术主要有图片相似度识别、文字标签、基于水印等技术。大多数图片相似度的技术都是使用sift等方法实现,运算量大而且对于同源图片的识别准确率不高,主要因为sift等方法都是基于模糊匹配,对边缘光滑的目标无法准确提取特征点,不能保证图片确切相似,更无法保证是同源图片。而基于文字标签的技术更是一种比较简单的技术,文字标签工作量大而且很难跨平台实现,同时也会因为用户操作丢失文字标签,因此在互联网大数据时代这些传统的技术很难实现精确快速的同源图片。

针对相关技术中很难实现精确快速地从数据库中检索出同源图像的问题,尚未提出解决方案。



技术实现要素:

本发明实施例提供了一种同源图像确定方法及装置,以至少解决相关技术中很难实现精确快速地从数据库中检索出同源图像的问题。

根据本发明的一个实施例,提供了一种同源图像确定方法,包括:

获取待处理的目标图像与数据库中的多个图像;

确定所述目标图像的特征向量,并获取所述多个图像的特征张量;

确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;

将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像。

可选地,确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量包括:

将所述目标图像的特征向量扩展为与所述多个图像的特征张量相同维度的特征张量;

将扩展后的所述目标图像的特征张量与所述多个图像的特征张量进行拼接,得到第一拼接特征张量;

将所述第一拼接特征张量输入到预先训练好的评估模型中,得到所述评估模型输出的评估矩阵;

根据所述评估矩阵确定上述第一评估向量;

将所述第一评估向量确定为所述目标评估向量。

可选地,在根据所述评估矩阵确定上述第一评估向量之后,所述方法还包括:

确定所述目标图像的特征向量与所述多个图像的特征张量的余弦相似度,得到第二评估向量;

确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量包括:

将所述第一评估向量与所述第二评估向量的乘积确定为所述目标评估向量。

可选地,将所述第一拼接特征张量输入到预先训练好的评估模型中,得到所述评估模型输出的评估矩阵包括:

将所述第一拼接特征张量输入所述目标评估模型的第一层全连接层,得到所述第一层全连接层输出的第一特征张量;

将所述第一特征张量输入所述目标评估模型的第二层全连接层,得到所述第二层全连接处输出的第二特征张量;

将所述第二特征张量输入所述目标评估模型的softmax层,得到所述softmax层输出的评估矩阵,其中,所述评估矩阵为二维矩阵;所述评估矩阵的行索引对应数据库中多个图像的编号,列索引对应是否为同源图像,所述评估矩阵的第一列对应数据库中每个图像与所述目标图像为非同源图像的概率,第二列对应数据库中每个图像与目标图像为同源图像的概率;

根据所述评估矩阵确定上述第一评估向量包括:

从所述评估矩阵中选取第二列向量确定为所述第一评估向量。

可选地,确定所述目标图像的特征向量包括:

将所述目标图像输入预先训练好的目标神经网络模型,得到所述目标神经网络模型输出的所述目标图像对应的特征向量。

可选地,在获取待处理的目标图像与数据库中的多个图像之前,所述方法还包括:

获取预定数量的原始图像、以及所述原始图像对应的一组图像,其中,所述一组图像是相同数量的与所述原始图像对应的同源图像和非同源图像的集合;

使用所述预定数量的原始图像以及所述原始图像对应的一组图像对原始神经网络模型进行训练,得到所述目标神经网络模型,其中,所述预定数量的原始图像以及所述原始图像对应的一组图像为所述原始神经网络模型的输入,训练好的所述目标神经网络模型输出的所述原始图像的特征向量与所述原始图像实际对应的特征向量满足预定目标函数,训练好的所述目标神经网络模型输出的所述一组图像的特征张量与所述一组图像实际对应的特征张量满足预定目标函数。

可选地,在使用所述预定数量的原始图像以及所述原始图像对应的一组图像对原始神经网络模型进行训练,得到所述目标神经网络模型之后,所述方法还包括:

将所述原始图像的特征向量扩展为与所述一组图像的特征张量相同维度的特征张量;

将扩展后的所述原始图像的特征张量与所述一组图像的特征张量进行拼接,得到拼接后的第二拼接特征张量;

根据所述第二拼接特征张量对原始评估模型进行训练,得到所述目标评估模型,其中,所述第二拼接特征张量为所述原始评估模型的输入,训练好的所述目标评估模型输出的所述第二拼接特征张量的评估矩阵与所述第二拼接特征张量对应的评估矩阵满足预定函数。

根据本发明的另一个实施例,还提供了一种同源图像确定装置,包括:

第一获取模块,用于获取待处理的目标图像与数据库中的多个图像;

第一确定模块,用于确定所述目标图像的特征向量,并获取所述多个图像的特征张量;

第二确定模块,用于确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;

第三确定模块,用于将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像。

可选地,所述第二确定模块包括:

扩展子模块,用于将所述目标图像的特征向量扩展为与所述多个图像的特征张量相同维度的特征张量;

拼接子模块,用于将扩展后的所述目标图像的特征张量与所述多个图像的特征张量进行拼接,得到第一拼接特征张量;

输入子模块,用于将所述第一拼接特征张量输入到预先训练好的评估模型中,得到所述评估模型输出的评估矩阵;

第一确定子模块,用于根据所述评估矩阵确定所述第一评估向量;

第二确定子模块,用于将所述第一评估向量确定为所述目标评估向量。

可选地,所述装置还包括:

第三确定子模块,用于确定所述目标图像的特征向量与所述多个图像的特征张量的余弦相似度,得到第二评估向量;

第四确定子模块,用于确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量包括:

第五确定子模块,用于将所述第一评估向量与所述第二评估向量的乘积确定为所述目标评估向量。

可选地,所述输入子模块,还用于

将所述第一拼接特征张量输入所述目标评估模型的第一层全连接层,得到所述第一层全连接层输出的第一特征张量;

将所述第一特征张量输入所述目标评估模型的第二层全连接层,得到所述第二层全连接处输出的第二特征张量;

将所述第二特征张量输入所述目标评估模型的softmax层,得到所述softmax层输出的评估矩阵,其中,所述评估矩阵为二维矩阵;所述评估矩阵的行索引对应数据库中多个图像的编号,列索引对应是否为同源图像,所述评估矩阵的第一列对应数据库中每个图像与所述目标图像为非同源图像的概率,第二列对应数据库中每个图像与目标图像为同源图像的概率;

所述第二确定子模块,还用于从所述评估矩阵中选取第二列向量确定为所述第一评估向量。

可选地,所述第一确定模块,还用于

将所述目标图像输入预先训练好的目标神经网络模型,得到所述目标神经网络模型输出的所述目标图像对应的特征向量。

可选地,所述装置还包括:

第二获取模块,用于获取预定数量的原始图像、以及所述原始图像对应的一组图像,其中,所述一组图像是相同数量的与所述原始图像对应的同源图像和非同源图像的集合;

第一训练模块,用于使用所述预定数量的原始图像以及所述原始图像对应的一组图像对原始神经网络模型进行训练,得到所述目标神经网络模型,其中,所述预定数量的原始图像以及所述原始图像对应的一组图像为所述原始神经网络模型的输入,训练好的所述目标神经网络模型输出的所述原始图像的特征向量与所述原始图像实际对应的特征向量满足预定目标函数,训练好的所述目标神经网络模型输出的所述一组图像的特征张量与所述一组图像实际对应的特征张量满足预定目标函数。

可选地,所述装置还包括:

扩展模块,用于将所述原始图像的特征向量扩展为与所述一组图像的特征张量相同维度的特征张量;

拼接模块,用于将扩展后的所述原始图像的特征张量与所述一组图像的特征张量进行拼接,得到拼接后的第二拼接特征张量;

第二训练模块,用于根据所述第二拼接特征张量对原始评估模型进行训练,得到所述目标评估模型,其中,所述第二拼接特征张量为所述原始评估模型的输入,训练好的所述目标评估模型输出的所述第二拼接特征张量的评估矩阵与所述第二拼接特征张量对应的评估矩阵满足预定函数。

根据本发明的又一个实施例,还提供了一种计算机可读的存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明,获取待处理的目标图像与数据库中的多个图像;确定所述目标图像的特征向量,并获取所述多个图像的特征张量;确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像,可以解决相关技术中很难实现精确快速地从数据库中检索出同源图像的问题,能够快速准确地从数据库中确定同源图像。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明实施例的一种同源图像确定方法的移动终端的硬件结构框图;

图2是根据本发明实施例的一种同源图像确定方法的流程图;

图3是根据本发明实施例的基于卷积神经网络的同源图片确定方法的流程图一;

图4是根据本发明实施例的基于卷积神经网络的同源图片确定方法的流程图二;

图5是根据本发明实施例的同源图像确定装置的框图;

图6是根据本发明优选实施例的同源图像确定装置的框图一;

图7是根据本发明优选实施例的同源图像确定装置的框图二。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种同源图像确定方法的移动终端的硬件结构框图,如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的报文接收方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。

基于上述的移动终端或网络架构,在本实施例中提供了一种同源图像确定方法,图2是根据本发明实施例的一种同源图像确定方法的流程图,如图2所示,该流程包括如下步骤:

步骤s202,获取待处理的目标图像与数据库中的多个图像;

步骤s204,确定所述目标图像的特征向量,并获取所述多个图像的特征张量;

步骤s206,确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;

步骤s208,将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像。

通过上述步骤s202至s208,获取待处理的目标图像与数据库中的多个图像;确定所述目标图像的特征向量,并获取所述多个图像的特征张量;确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像,可以解决相关技术中很难实现精确快速确定的同源图像的问题,能够快速准确确定同源图像。

本发明实施例中的目标评估向量的确定方式有多种,在一可选的实施例中,上述步骤s206具体可以包括:将所述目标图像的特征向量扩展为与所述多个图像的特征张量相同维度的特征张量;将扩展后的所述目标图像的特征张量与所述多个图像的特征张量进行拼接,得到第一拼接特征张量;将所述第一拼接特征张量输入到预先训练好的评估模型中,得到所述评估模型输出的评估矩阵;根据所述评估矩阵确定上述第一评估向量;将所述第一评估向量确定为所述目标评估向量。

在另一可选的实施例中,在根据所述评估矩阵确定上述第一评估向量之后,确定所述目标图像的特征向量与所述多个图像的特征张量的余弦相似度,得到第二评估向量;对应的上述步骤s206具体包括:将所述第一评估向量与所述第二评估向量的乘积确定为所述目标评估向量。

进一步的,将所述第一拼接特征张量输入到预先训练好的评估模型中,得到所述评估模型输出的评估矩阵具体可以包括:

将所述第一拼接特征张量输入所述目标评估模型的第一层全连接层,得到所述第一层全连接层输出的第一特征张量;

将所述第一特征张量输入所述目标评估模型的第二层全连接层,得到所述第二层全连接处输出的第二特征张量;

将所述第二特征张量输入所述目标评估模型的softmax层,得到所述softmax层输出的评估矩阵,其中,所述评估矩阵为二维矩阵;所述评估矩阵的行索引对应数据库中多个图像的编号,列索引对应是否为同源图像,所述评估矩阵的第一列对应数据库中每个图像与所述目标图像为非同源图像的概率,第二列对应数据库中每个图像与目标图像为同源图像的概率;

对应的,根据所述评估矩阵确定上述第一评估向量具体包括:

从所述评估矩阵中选取第二列向量确定为所述第一评估向量。

本发明实施例中,上述步骤s204具体可以包括:将所述目标图像输入预先训练好的目标神经网络模型,得到所述目标神经网络模型输出的所述目标图像对应的特征向量。

本发明实施例中,在获取待处理的目标图像与数据库中的多个图像之前,对目标神经网络模型和目标评估模型进行训练,具体的,获取预定数量的原始图像、以及所述原始图像对应的一组图像,其中,所述一组图像是相同数量的与所述原始图像对应的同源图像和非同源图像的集合;

使用所述预定数量的原始图像以及所述原始图像对应的一组图像对原始神经网络模型进行训练,得到所述目标神经网络模型,其中,所述预定数量的原始图像以及所述原始图像对应的一组图像为所述原始神经网络模型的输入,训练好的所述目标神经网络模型输出的所述原始图像的特征向量与所述原始图像实际对应的特征向量满足预定目标函数,训练好的所述目标神经网络模型输出的所述一组图像的特征张量与所述一组图像实际对应的特征张量满足预定目标函数。

进一步的,在使用所述预定数量的原始图像以及所述原始图像对应的一组图像对原始神经网络模型进行训练,得到所述目标神经网络模型之后,将所述原始图像的特征向量扩展为与所述一组图像的特征张量相同维度的特征张量;将扩展后的所述原始图像的特征张量与所述一组图像的特征张量进行拼接,得到拼接后的第二拼接特征张量;根据所述第二拼接特征张量对原始评估模型进行训练,得到所述目标评估模型,其中,所述第二拼接特征张量为所述原始评估模型的输入,训练好的所述目标评估模型输出的所述第二拼接特征张量的评估矩阵与所述第二拼接特征张量对应的评估矩阵满足预定函数。

下面以目标评估模型为特征相似性评估模型a、余弦相似度计算模型为建立特征相似性评估模型b为例对同源图像的确定进行详细说明。

图3是根据本发明实施例的基于卷积神经网络的同源图片确定方法的流程图一,如图3所示,包括:

s301,建立特征提取模型,具体包括:对所述特征提取模型输入原图和一组图像,得到原图对应的特征向量和这组图像对应的特征张量,将原图对应的特征向量扩展到跟这组图像对应的特征张量相同的维度上,所述一组图像是等数量的与原图对应的同源图像和非同源图像集。

s302,建立特征相似性评估模型a,具体为:对所述特征提取模型获取的张量,输入到特征相似度评估模型a中,进行相似性对比,给出评分,生成一个评估向量a,其中,评估向量a对应上述第一相似度评估向量,评估向量b对应上述第二相似度评估向量。

s303,建立特征相似性评估模型b,过程与s302相同,生成一个评估向量b。

s304,两个评估向量作点乘处理,得到最终评估向量,对结果进行降序排序。

s305,根据阈值划分,在阈值内的图像即为同源图像,训练阶段阈值设为0.5。

s306,基于所述特征提取模型,获得第一目标图像与第二目标图像所对应的特征向量。

s307,基于所述特征相似性评估模型a和b,得到所述特征提取模型获取的张量的评估向量a和评估向量b,作点乘计算得到最终评估向量,其中,最终评估向量对应上述目标相似度评估向量,根据目标相似度评估向量便可以计算出所述相似度值,若所述相似度值在阈值范围内,则可确定为同源图像,若所述相似度值不在阈值范围内,则可确定为非同源图像,阈值设置视具体数据集而定。

本发明实施例除了可以识别多张图像或图片是否为同源,也可以根据一张图片从数据库中检索是否存在与其同源的图片,下面以从数据库中检索同源图片为例对本发明实施例进行详细说明。

图4是根据本发明实施例的基于卷积神经网络的同源图片确定方法的流程图二,如图4所示,包括:

s401,建立特征提取模型,具体包括:对所述特征提取模型输入原图和一组图片,得到原图对应的特征向量和这组图片对应的特征张量,将原图对应的特征向量扩展到跟这组图片对应的特征张量相同的维度上,所述一组图片是等数量的与原图对应的同源图片和非同源图片集。

s402,建立特征相似性评估模型a,具体为:对所述特征提取模型获取的张量,输入到特征相似度评估模型a中,进行相似性对比,给出评分,生成一个评估向量a。

s403,建立特征相似性评估模型b,过程与s402相同,生成一个评估向量b。

s404,两个评估向量作点乘处理,得到最终评估向量,对结果进行降序排序。

s405,根据阈值划分,在阈值内的图片即为同源图片,训练阶段阈值设为0.5。

s406,基于所述特征提取模型,获得数据库中每张原始图片所对应的特征张量和所有图片所对应的特征张量。

s407,基于所述特征相似性评估模型a和b,得到所述特征提取模型获取的张量的评估向量a和b,作点乘计算得到最终评估向量,降序排序,划分在阈值内的图片为检索到的同源图片,阈值设置视具体数据集而定。

上述步骤s301或s401中,建立特征提取模型,具体地,cnn是vgg网络的标准卷积结构。每层卷积层的运算是一样的,不一样的是每层卷积层获取的数据不同。设上一层卷积层的输出向量为x,下一层卷积层所做计算为其中w表示卷积核的参数,表示卷积在输入数据上作用的区域,b是该层的偏置,f是激活函数。在卷积结构之后,接两层全连接层,即fc,若卷积结构最终输出向量为x,全连接层所做计算为y=(ax+b),其中a表示该层的权重参数,b表示该层的偏置,f为激活函数。输入原图和一组由n/2张同源图片、n/2张非同源图片打包成的图片集到特征提取模型中。本发明实施例中,对应原图,生成一个1*512维的特征向量,对应n张图片集,生成一个n*512维的特征张量。将原图对应的特征向量扩展成n*512维特征张量,然后和图片集对应的n*512维特征张量拼接在一起,得到n*1024维的特征张量。本发明实施例中,n=120。上述过程为建立了特征提取模型。

接着,对提取的特征张量进行相似度分析,上述步骤s302和s402中,建立特征相似性评估模型a,具体地,fc1是一个全连接层,在本发明实施例中,有512个节点,fc2是一个只有两个节点的全连接层,最后接一个softmax层进行二分类,得到每张图片是否为同源图片的概率值,softmax函数为

其中si表示第i个节点的概率值,ej表示第j个节点向量值。将s301获取到的特征张量输入fc1,经过fc1、fc2和softmax,得到一个n*2维特征张量。一般地,特征张量的第二列为我们想要的预测结果,所以,取特征张量的第二列作为最终的评估向量a,尺度是n*1维。本发明实施例中,n=120。上述过程为建立了特征相似性评估模型a。

上述s303或s403中,建立特征相似性评估模型b。具体地,对s301或s401获得的特征张量计算余弦相似度,计算公式是:

其中a表示原图对应的特征向量,b表示图片集中任一张图片对应的特征向量。经过评估模型b计算得到一个n*1维的评估向量b。上述过程为建立了特征相似性评估模型b。

然后,计算评估向量a与评估向量b的数量积,即计算a*b,所得结果作为最终的评估向量。对最终的评估向量进行降序排序,根据预先设置的阈值,划分在阈值内的图片为检索到的同源图片。本发明实施例中,阈值设为0.5。

上述过程仅是模型训练的过程,获得训练好的同源图片检索模型。

接下来,基于训练好的同源图片检索模型处理真实数据集。

具体地,步骤s306或s406中,基于所述特征提取模型,获取所有图片对应的n*512维特征张量。再依次获取每张原始图片对应的特征张量,拼接得到每张原始图片对应的n*1024维特征张量。本发明实施例中,数据库共有图片2000000张,要检索的原始图片为1000张,每张原始图片有60张同源图片,得到的特征张量维度是2000000*1024。

最后,上述s307或s407,基于所述特征相似性评估模型a和b,计算得到s306或s406生成的每个特征张量所对应的评估向量a和b,计算评估向量a与评估向量b的数量积,即a*b,得到最终的评估向量。对最终评估向量进行降序排序,根据阈值,划分在阈值内的图片为检索到的同源图片,本发明实施例中,阈值设为0.00003。

也就是说,在输入任意一张原始图片时,通过上述的方法,能够在数据库中找到对应的同源图片。

本发明实施例,对于在大量数据中检索同源图片的可行性很高,检索的速度和精度较传统方法有很大提升,且因为网络模型可用不同数据集进行训练,因此具有良好的泛化性。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种同源图像确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本发明实施例的同源图像确定装置的框图,如图5所示,包括:

第一获取模块52,用于获取待处理的目标图像与数据库中的多个图像;

第一确定模块54,用于确定所述目标图像的特征向量,并获取所述多个图像的特征张量;

第二确定模块56,用于确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;

第三确定模块58,用于将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像。

图6是根据本发明优选实施例的同源图像确定装置的框图一,如图6所示,所述第二确定模块56包括:

扩展子模块62,用于将所述目标图像的特征向量扩展为与所述多个图像的特征张量相同维度的特征张量;

拼接子模块64,用于将扩展后的所述目标图像的特征张量与所述多个图像的特征张量进行拼接,得到第一拼接特征张量;

输入子模块66,用于将所述第一拼接特征张量输入到预先训练好的评估模型中,得到所述评估模型输出的评估矩阵;

第一确定子模块68,用于根据所述评估矩阵确定所述第一评估向量;

第二确定子模块610,用于将所述第一评估向量确定为所述目标评估向量。

图7是根据本发明优选实施例的同源图像确定装置的框图二,如图7所示,所述装置还包括:

第三确定子模块72,用于确定所述目标图像的特征向量与所述多个图像的特征张量的余弦相似度,得到第二评估向量;

第四确定子模块74,用于确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量包括:

第五确定子模块76,用于将所述第一评估向量与所述第二评估向量的乘积确定为所述目标评估向量。

可选地,所述输入子模块66,还用于

将所述第一拼接特征张量输入所述目标评估模型的第一层全连接层,得到所述第一层全连接层输出的第一特征张量;

将所述第一特征张量输入所述目标评估模型的第二层全连接层,得到所述第二层全连接处输出的第二特征张量;

将所述第二特征张量输入所述目标评估模型的softmax层,得到所述softmax层输出的评估矩阵,其中,所述评估矩阵为二维矩阵;所述评估矩阵的行索引对应数据库中多个图像的编号,列索引对应是否为同源图像,所述评估矩阵的第一列对应数据库中每个图像与所述目标图像为非同源图像的概率,第二列对应数据库中每个图像与目标图像为同源图像的概率;

所述第二确定子模块,还用于从所述评估矩阵中选取第二列向量确定为所述第一评估向量。

可选地,所述第一确定模块54,还用于

将所述目标图像输入预先训练好的目标神经网络模型,得到所述目标神经网络模型输出的所述目标图像对应的特征向量。

可选地,所述装置还包括:

第二获取模块,用于获取预定数量的原始图像、以及所述原始图像对应的一组图像,其中,所述一组图像是相同数量的与所述原始图像对应的同源图像和非同源图像的集合;

第一训练模块,用于使用所述预定数量的原始图像以及所述原始图像对应的一组图像对原始神经网络模型进行训练,得到所述目标神经网络模型,其中,所述预定数量的原始图像以及所述原始图像对应的一组图像为所述原始神经网络模型的输入,训练好的所述目标神经网络模型输出的所述原始图像的特征向量与所述原始图像实际对应的特征向量满足预定目标函数,训练好的所述目标神经网络模型输出的所述一组图像的特征张量与所述一组图像实际对应的特征张量满足预定目标函数。

可选地,所述装置还包括:

扩展模块,用于将所述原始图像的特征向量扩展为与所述一组图像的特征张量相同维度的特征张量;

拼接模块,用于将扩展后的所述原始图像的特征张量与所述一组图像的特征张量进行拼接,得到拼接后的第二拼接特征张量;

第二训练模块,用于根据所述第二拼接特征张量对原始评估模型进行训练,得到所述目标评估模型,其中,所述第二拼接特征张量为所述原始评估模型的输入,训练好的所述目标评估模型输出的所述第二拼接特征张量的评估矩阵与所述第二拼接特征张量对应的评估矩阵满足预定函数。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,获取待处理的目标图像与数据库中的多个图像;

s2,确定所述目标图像的特征向量,并获取所述多个图像的特征张量;

s3,确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;

s4,将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像。

可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-onlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

实施例4

本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

s1,获取待处理的目标图像与数据库中的多个图像;

s2,确定所述目标图像的特征向量,并获取所述多个图像的特征张量;

s3,确定所述目标图像的特征向量与所述多个图像的特征张量的目标评估向量,其中,所述目标评估向量的各个分量表示所述多个图像与所述目标图像为同源图像的概率;

s4,将大于或等于预设阈值的所述目标评估向量的分量对应的图像确定为所述待处理图像的同源图像。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1