确定图片相似度的方法和装置的制造方法

文档序号:9709064阅读:271来源:国知局
确定图片相似度的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及通信领域,特别涉及一种确定图片相似度的方法和装置。
【背景技术】
[0002] 随着互联网技术的发展,效果广告的应用越来越多。效果广告是指广告主只需要 为可衡量的结果付费的广告。效果广告普遍应用于电商网站、社交平台、或移动应用等。效 果广告的内容绝大多数为图片,基于图片的特征抽取和相似度计算已经成为实现业务逻辑 必不可少的技术手段。
[0003] 目前,常见的图片相似度计算方法如下:首先对图片做特征抽取,如GIST特征;然 后对某些局部特征做抽象化,如聚类;再将这些特征泛化为特征向量;最后利用相似度公 式如欧氏距离公式计算得到图片相似度。
[0004] 但是,上述方法中特征抽取都是基于手工实现,需要人员具备较强的专业知识,对 人员的要求较高,而且整个过程需要耗费大量时间,效率较低。

【发明内容】

[0005] 有鉴于此,本发明实施例提供了一种确定图片相似度的方法和装置,以实现自动 提取特征,提高确定相似度的效率。所述技术方案如下:
[0006] -方面,提供了一种确定图片相似度的方法,所述方法包括:
[0007] 使用训练数据训练神经网络模型得到图片特征抽取模型;
[0008] 将第一图片和第二图片输入至所述图片特征抽取模型,得到输出神经元作为特征 的各层上所述第一图片的特征向量和所述第二图片的特征向量;
[0009] 对所述各层分别计算所述第一图片的特征向量和所述第二图片的特征向量之间 的相似度;
[0010] 根据所述各层上所述第一图片的特征向量和所述第二图片的特征向量之间的相 似度,计算得到所述第一图片和第二图片的相似度。
[0011] 另一方面,提供了一种确定图片相似度的装置,所述装置包括:
[0012] 训练模块,用于使用训练数据训练神经网络模型得到图片特征抽取模型;
[0013] 特征提取模块,用于将第一图片和第二图片输入至所述图片特征抽取模型,得到 输出神经元作为特征的各层上所述第一图片的特征向量和所述第二图片的特征向量;
[0014] 第一计算模块,用于对所述各层分别计算所述第一图片的特征向量和所述第二图 片的特征向量之间的相似度;
[0015] 第二计算模块,用于根据所述各层上所述第一图片的特征向量和所述第二图片的 特征向量之间的相似度,计算得到所述第一图片和第二图片的相似度。
[0016] 本发明实施例提供的技术方案带来的有益效果是:使用训练数据训练神经网络模 型得到图片特征抽取模型;将第一图片和第二图片输入至所述图片特征抽取模型,得到输 出神经元作为特征的各层上所述第一图片的特征向量和所述第二图片的特征向量;对所述 各层分别计算所述第一图片的特征向量和所述第二图片的特征向量之间的相似度;根据所 述各层上所述第一图片的特征向量和所述第二图片的特征向量之间的相似度,计算得到所 述第一图片和第二图片的相似度;其中,基于图片特征抽取模型实现了特征的自动抽取,无 需依赖手工,极大地节省了人力和时间,提高了确定相似度的效率。
【附图说明】
[0017] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。
[0018] 图1是本发明一实施例提供的确定图片相似度的方法流程图;
[0019] 图2是本发明另一实施例提供的确定图片相似度的方法流程图;
[0020] 图3是本发明另一实施例提供的深度卷积神经网络的结构示意图;
[0021] 图4是本发明另一实施例提供的卷积层的可视化特征示意图;
[0022] 图5(a)~(d)是本发明另一实施例提供的图片相似度的计算结果示意图;
[0023] 图6(a)~(c)是本发明另一实施例提供的图片分类的示意图;
[0024] 图7是本发明另一实施例提供的确定图片相似度的装置结构图;
[0025] 图8是本发明另一实施例提供的确定图片相似度的装置结构图;
[0026] 图9是本发明另一实施例提供的服务器结构图。
【具体实施方式】
[0027] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。
[0028] 参见图1,本发明一实施例提供了一种确定图片相似度的方法,包括:
[0029] 101 :使用训练数据训练神经网络模型得到图片特征抽取模型。
[0030] 神经网络(Neural Networks,·)是由大量的、简单的处理单元(称为神经元)广 泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复 杂的非线性动力学习系统。神经网络模型具有大规模并行、分布式存储和处理、自组织、自 适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处 理问题。
[0031] 本实施例中,所述训练数据可以是图片,图片的类型不限,如可以是电商行业的图 片或者ImageNet数据库中的图片等等。
[0032] 102:将第一图片和第二图片输入至该图片特征抽取模型,得到输出神经元作为特 征的各层上该第一图片的特征向量和该第二图片的特征向量。
[0033] 其中,第一图片和第二图片为任意两个图片,通过本实施例提供的方法来确定第 一图片和第二图片的相似度。
[0034] 103:对该各层分别计算该第一图片的特征向量和该第二图片的特征向量之间的 相似度。
[0035] 本实施例中,所述输出神经元作为特征的各层通常由多层,则其中的每一层都可 以得到第一图片的特征向量,也可以得到第二图片的特征向量。
[0036] 例如,特征抽取模型中输出神经元作为特征的共有3层,A层、B层和C层,则将第 一图片输入该模型后可以得到第一图片在A层输出的特征向量Val、在B层输出的特征向 量Vbl和在C层输出的特征向量Vcl ;将第二图片输入该模型后可以得到第二图片在A层 输出的特征向量Va2、在B层输出的特征向量Vb2和在C层输出的特征向量Vc2。在计算特 征向量的相似度时,可以分别计算Val和Va2的相似度、Vbl和Vb2的相似度、以及Vcl和 Vc2的相似度。
[0037] 104:根据该各层上该第一图片的特征向量和该第二图片的特征向量之间的相似 度,计算得到该第一图片和第二图片的相似度。
[0038] 这里可以采用回归算法来计算两个图片的相似度,各层上计算得到的特征向量之 间的相似度可以取不同的权重,通过调整权重值可以使图片相似度的计算结果更准确,提 高计算精度。
[0039] 本实施例中,图片的相似度表征为[0, 1]之间的浮点数,数值越大表示越相似,数 值越小表示越不相似。
[0040] 本实施例中,可选的,所述使用训练数据训练神经网络模型得到图片特征抽取模 型,可以包括:
[0041] 使用训练数据基于反向传播算法训练深度卷积神经网络模型,得到图片特征抽取 模型;或,
[0042] 使用训练数据训练深度自动编码器,得到图片特征抽取模型。
[0043] 进一步地,所述使用训练数据基于反向传播算法训练深度卷积神经网络模型,得 到图片特征抽取模型,可以包括:
[0044] 选取深度卷积神经网络模型,所述深度卷积神经网络模型包括Μ层卷积层和N层 全连接层;
[0045] 在Μ+Ν层中选取指定的Κ层做特征抽取,以该Κ层的神经元输出作为特征向量;
[0046] 使用训练数据基于反向传播算法训练该深度卷积神经网络模型,得到具有Κ个特 征向量的图片特征抽取模型。
[0047] 本实施例中,优选地,所述Κ层均为全连接层,或者包括卷积层和全连接层。
[0048] 本实施例中,可选的,所述对该各层分别计算该第一图片的特征向量和该第二图 片的特征向量之间的相似度,可以包括:
[0049] 使用余弦算法、Jaccard算法或Pearson算法,对该各层分别计算该第一图片的特 征向量和该第二图片的特征向量之间的相似度。
[0050] 本实施例中,可选的,所述根据该各层上该第一图片的特征向量和该第二图片的 特征向量之间的相似度,计算得到该第一图片和第二图片的相似度,可以包括:
[0051] 使用线性回归算法或逻辑回归算法,根据该各层上该第一图片的特征向量和该第 二图片的特征向量之间的相似度,计算得到该第一图片和第二图片的相似度。
[0052] 本实施例提供的上述方法,使用训练数据训练神经网络模型得到图片特征抽取模 型
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1