确定图片相似度的方法和装置的制造方法

文档序号：9709064阅读：271来源：国知局

确定图片相似度的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及通信领域，特别涉及一种确定图片相似度的方法和装置。
【背景技术】
[0002] 随着互联网技术的发展，效果广告的应用越来越多。效果广告是指广告主只需要为可衡量的结果付费的广告。效果广告普遍应用于电商网站、社交平台、或移动应用等。效果广告的内容绝大多数为图片，基于图片的特征抽取和相似度计算已经成为实现业务逻辑必不可少的技术手段。
[0003] 目前，常见的图片相似度计算方法如下：首先对图片做特征抽取，如GIST特征；然后对某些局部特征做抽象化，如聚类；再将这些特征泛化为特征向量；最后利用相似度公式如欧氏距离公式计算得到图片相似度。
[0004] 但是，上述方法中特征抽取都是基于手工实现，需要人员具备较强的专业知识，对人员的要求较高，而且整个过程需要耗费大量时间，效率较低。

【发明内容】

[0005] 有鉴于此，本发明实施例提供了一种确定图片相似度的方法和装置，以实现自动提取特征，提高确定相似度的效率。所述技术方案如下：
[0006] -方面，提供了一种确定图片相似度的方法，所述方法包括：
[0007] 使用训练数据训练神经网络模型得到图片特征抽取模型；
[0008] 将第一图片和第二图片输入至所述图片特征抽取模型，得到输出神经元作为特征的各层上所述第一图片的特征向量和所述第二图片的特征向量；
[0009] 对所述各层分别计算所述第一图片的特征向量和所述第二图片的特征向量之间的相似度；
[0010] 根据所述各层上所述第一图片的特征向量和所述第二图片的特征向量之间的相似度，计算得到所述第一图片和第二图片的相似度。
[0011] 另一方面，提供了一种确定图片相似度的装置，所述装置包括：
[0012] 训练模块，用于使用训练数据训练神经网络模型得到图片特征抽取模型；
[0013] 特征提取模块，用于将第一图片和第二图片输入至所述图片特征抽取模型，得到输出神经元作为特征的各层上所述第一图片的特征向量和所述第二图片的特征向量；
[0014] 第一计算模块，用于对所述各层分别计算所述第一图片的特征向量和所述第二图片的特征向量之间的相似度；
[0015] 第二计算模块，用于根据所述各层上所述第一图片的特征向量和所述第二图片的特征向量之间的相似度，计算得到所述第一图片和第二图片的相似度。
[0016] 本发明实施例提供的技术方案带来的有益效果是：使用训练数据训练神经网络模型得到图片特征抽取模型；将第一图片和第二图片输入至所述图片特征抽取模型，得到输出神经元作为特征的各层上所述第一图片的特征向量和所述第二图片的特征向量；对所述各层分别计算所述第一图片的特征向量和所述第二图片的特征向量之间的相似度；根据所述各层上所述第一图片的特征向量和所述第二图片的特征向量之间的相似度，计算得到所述第一图片和第二图片的相似度；其中，基于图片特征抽取模型实现了特征的自动抽取，无需依赖手工，极大地节省了人力和时间，提高了确定相似度的效率。
【附图说明】
[0017] 为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0018] 图1是本发明一实施例提供的确定图片相似度的方法流程图；
[0019] 图2是本发明另一实施例提供的确定图片相似度的方法流程图；
[0020] 图3是本发明另一实施例提供的深度卷积神经网络的结构示意图；
[0021] 图4是本发明另一实施例提供的卷积层的可视化特征示意图；
[0022] 图5(a)~（d)是本发明另一实施例提供的图片相似度的计算结果示意图；
[0023] 图6(a)~（c)是本发明另一实施例提供的图片分类的示意图；
[0024] 图7是本发明另一实施例提供的确定图片相似度的装置结构图；
[0025] 图8是本发明另一实施例提供的确定图片相似度的装置结构图；
[0026] 图9是本发明另一实施例提供的服务器结构图。
【具体实施方式】
[0027] 为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。
[0028] 参见图1，本发明一实施例提供了一种确定图片相似度的方法，包括：
[0029] 101 :使用训练数据训练神经网络模型得到图片特征抽取模型。
[0030] 神经网络（Neural Networks，·)是由大量的、简单的处理单元（称为神经元）广泛地互相连接而形成的复杂网络系统，它反映了人脑功能的许多基本特征，是一个高度复杂的非线性动力学习系统。神经网络模型具有大规模并行、分布式存储和处理、自组织、自适应和自学能力，特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。
[0031] 本实施例中，所述训练数据可以是图片，图片的类型不限，如可以是电商行业的图片或者ImageNet数据库中的图片等等。
[0032] 102:将第一图片和第二图片输入至该图片特征抽取模型，得到输出神经元作为特征的各层上该第一图片的特征向量和该第二图片的特征向量。
[0033] 其中，第一图片和第二图片为任意两个图片，通过本实施例提供的方法来确定第一图片和第二图片的相似度。
[0034] 103:对该各层分别计算该第一图片的特征向量和该第二图片的特征向量之间的相似度。
[0035] 本实施例中，所述输出神经元作为特征的各层通常由多层，则其中的每一层都可以得到第一图片的特征向量，也可以得到第二图片的特征向量。
[0036] 例如，特征抽取模型中输出神经元作为特征的共有3层，A层、B层和C层，则将第一图片输入该模型后可以得到第一图片在A层输出的特征向量Val、在B层输出的特征向量Vbl和在C层输出的特征向量Vcl ;将第二图片输入该模型后可以得到第二图片在A层输出的特征向量Va2、在B层输出的特征向量Vb2和在C层输出的特征向量Vc2。在计算特征向量的相似度时，可以分别计算Val和Va2的相似度、Vbl和Vb2的相似度、以及Vcl和 Vc2的相似度。
[0037] 104:根据该各层上该第一图片的特征向量和该第二图片的特征向量之间的相似度，计算得到该第一图片和第二图片的相似度。
[0038] 这里可以采用回归算法来计算两个图片的相似度，各层上计算得到的特征向量之间的相似度可以取不同的权重，通过调整权重值可以使图片相似度的计算结果更准确，提高计算精度。
[0039] 本实施例中，图片的相似度表征为[0, 1]之间的浮点数，数值越大表示越相似，数值越小表示越不相似。
[0040] 本实施例中，可选的，所述使用训练数据训练神经网络模型得到图片特征抽取模型，可以包括：
[0041] 使用训练数据基于反向传播算法训练深度卷积神经网络模型，得到图片特征抽取模型；或，
[0042] 使用训练数据训练深度自动编码器，得到图片特征抽取模型。
[0043] 进一步地，所述使用训练数据基于反向传播算法训练深度卷积神经网络模型，得到图片特征抽取模型，可以包括：
[0044] 选取深度卷积神经网络模型，所述深度卷积神经网络模型包括Μ层卷积层和N层全连接层；
[0045] 在Μ+Ν层中选取指定的Κ层做特征抽取，以该Κ层的神经元输出作为特征向量；
[0046] 使用训练数据基于反向传播算法训练该深度卷积神经网络模型，得到具有Κ个特征向量的图片特征抽取模型。
[0047] 本实施例中，优选地，所述Κ层均为全连接层，或者包括卷积层和全连接层。
[0048] 本实施例中，可选的，所述对该各层分别计算该第一图片的特征向量和该第二图片的特征向量之间的相似度，可以包括：
[0049] 使用余弦算法、Jaccard算法或Pearson算法，对该各层分别计算该第一图片的特征向量和该第二图片的特征向量之间的相似度。
[0050] 本实施例中，可选的，所述根据该各层上该第一图片的特征向量和该第二图片的特征向量之间的相似度，计算得到该第一图片和第二图片的相似度，可以包括：
[0051] 使用线性回归算法或逻辑回归算法，根据该各层上该第一图片的特征向量和该第二图片的特征向量之间的相似度，计算得到该第一图片和第二图片的相似度。
[0052] 本实施例提供的上述方法，使用训练数据训练神经网络模型得到图片特征抽取模型

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：姚伶伶;赫南;何琪;胡繁星;卫望;王兵;
技术所有人：腾讯科技（深圳）有限公司;
我是此专利的发明人

上一篇：触控装置及其校准方法
上一篇：处理高动态范围全景图的方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。