一种同款业务对象聚合、搜索的方法和系统的制作方法

文档序号:6502544阅读:127来源:国知局
一种同款业务对象聚合、搜索的方法和系统的制作方法
【专利摘要】本申请实施例提供了一种同款业务对象聚合的方法,所述的方法包括,获取业务对象的图像;根据所述图像的视觉特征生成所述图像的数字签名;采用所述图像及其对应的数字签名建立图像签名库;依据所述数字签名将图像签名库中的图像划分为多个分组;基于所述多个分组计算所述图像的相似度;按照所述相似度对所述图像进行聚类,形成一个或多个图像集合;将属于同一图像集合的图像对应的业务对象合并为同款业务对象。本申请实施例适用于大规模业务对象数据的处理,聚合效率高。
【专利说明】一种同款业务对象聚合、搜索的方法和系统

【技术领域】
[0001] 本申请实施例涉及数据搜索的【技术领域】,特别是涉及一种同款业务对象聚合的方 法、一种同款业务对象聚合的系统、一种搜索方法和一种搜索系统。

【背景技术】
[0002] 近年来,随着互联网的高速发展,网上的信息量急剧增加,其中包含了大量的图像 信息。随着各种图像处理工具的普及,图像的缩放、裁剪、添加水印等处理都给图像造成形 式上的变化,但图像内容实质上却基本相同。过量的重叠图像信息使得人们在信息检索的 时候要进行繁琐的人工过滤,耗费时间和精力。
[0003] 例如,在垂直搜索环境中,用户通过网站进行某一业务对象(比如商品)搜索时,同 款业务对象,即属性(例如,业务对象的图像、业务对象的名称、或业务对象的描述等)完全 或几乎相同的业务对象,在单次搜索结果中,有很大几率会被展示多次。同款业务对象的重 复展示降低了网站主提供信息的效率和用户获取信息的效率。
[0004] 目前,同款业务对象的聚合可以利用业务对象的类型、参数或名称等方式来进行。 但是当业务对象的类型、参数及名称等信息缺失或这些信息不足以进行不同款业务对象的 类型的区分时,往往需要靠人工来甄别、聚合。特别的,由于在网络环境中发布的商品的类 型和数量都在高速增长中,人工挑选同款商品的方式在时间和人力成本上越来越高,以至 于无法承受。
[0005] 因此,目前需要本领域技术人员迫切解决的一个技术问题就是:在信息搜索引擎 中,如何在互联网发布的海量商品信息中,将内容相同或相似的产品聚合为同一款业务对 象的类型,以提高信息搜索的效率。
[0006] 申请内容
[0007] 本申请实施例所要解决的技术问题是提供一种同款业务对象聚合及一种搜索方 法,能够基于业务对象的图像内容生成数字签名,并能进行快速验证,用以实现海量商品中 同款业务对象的聚合,在保证聚合效果的同时,提高聚合速度,将此应用于搜索领域,提高 信息搜索的效率。
[0008] 相应的,本申请实施例还提供了一种同款业务对象聚合的系统及一种搜索系统, 用以保证上述方法的实现及应用。
[0009] 为了解决上述问题,本申请公开了一种同款业务对象聚合的方法,包括:
[0010] 获取业务对象的图像;
[0011] 根据所述图像的视觉特征生成所述图像的数字签名;
[0012] 采用所述图像及其对应的数字签名建立图像签名库;
[0013] 依据所述数字签名将图像签名库中的图像划分为多个分组;
[0014] 基于所述多个分组计算所述图像的相似度;
[0015] 按照所述相似度对所述图像进行聚类,形成一个或多个图像集合;
[0016] 将属于同一图像集合的图像对应的业务对象合并为同款业务对象。
[0017] 较佳地,所述根据图像的视觉特征生成所述图像的数字签名的步骤包括:
[0018] 分别提取所述图像的视觉特征;所述视觉特征包括颜色特征,和/或,梯度特征, 和/或,局部特征;
[0019] 将所述视觉特征进行归一化,组合为对应图像的数字签名。
[0020] 较佳地,所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色 在当前图像中对应的像素点个数,当所述视觉特征包括颜色特征时,所述分别提取图像的 视觉特征的步骤包括:
[0021] 获得在预设颜色空间中量化的颜色维度;
[0022] 遍历所述图像中各像素点的颜色值,查找与所述各像素点的颜色值归属的颜色维 度;其中,所述各像素点的颜色值归属的颜色维度为与各像素点的颜色值距离最近的颜色 维度;
[0023] 统计各颜色维度在所述图像中对应的像素点个数,选择一个或多个像素点个数最 多的颜色维度作为当前图像的主颜色;
[0024] 获得所述主颜色在当前图像中对应的像素点个数;
[0025] 和 / 或,
[0026] 当所述视觉特征包括梯度特征时,所述分别提取图像的视觉特征的步骤包括:
[0027] 将所述图像转化为灰度图像,并对所述灰度图像进行平滑;
[0028] 依据所述平滑后的灰度图像计算所述图像的梯度方向直方图;
[0029] 采用所述梯度方向直方图及其对应的像素点个数作为当前图像的梯度特征;
[0030] 和 / 或,
[0031] 当所述视觉特征包括局部特征时,所述分别提取图像的视觉特征的步骤包括:
[0032] 提取所述图像中具有旋转不变性和尺度不变性的特征点;
[0033] 计算所述特征点的对比度变量,选取对比度变量大于预设第一门限值的特征点拼 接成所述图像的局部特征。
[0034] 较佳地,所述依据平滑后的灰度图像计算所述图像的梯度方向直方图的子步骤进 一步包括:
[0035] 针对平滑后的灰度图像,计算每一像素点的梯度方向和梯度幅值;
[0036] 对当前图像做梯度方向统计,生成当前图像的以梯度方向为横轴的直方图;
[0037] 将所述当前图像的梯度方向平均分成R个方向角度,生成R个方向角度分别对应 的R个直方图组距;其中,所述R为正整数;
[0038] 遍历图像中的所有像素点,分别根据每个像素点的梯度方向找出最接近的两个方 向角度对应的直方图组距,并根据接近程度从高到低分配权重系数;
[0039] 将所述像素点的梯度幅值乘以权重系数分别累加至所述最接近的两个方向角度 对应的直方图组距中;
[0040] 进行归一化,生成当前图像的梯度方向直方图。
[0041] 较佳地,所述依据数字签名将图像签名库中的图像划分为多个分组的步骤包括:
[0042] 提取所述图像的数字签名中的颜色特征;
[0043] 从所述颜色特征中提取分组主颜色;其中,所述分组主颜色包括最多像素点个数 对应的主颜色;和/或,通过计算所述图像中最多像素点个数对应的主颜色的像素点数量 占所述图像所有像素点数量的比例,在所述比例大于第二预设门限值时,所选取的对应像 素点个数次多的主颜色;
[0044] 按照所述分组主颜色将所述图像划分为多个分组,同一分组中图像的分组主颜色 相同。
[0045] 较佳地,所述基于多个分组计算所述图像的相似度的步骤包括:
[0046] 确定每张图像对应的主分组及相邻分组,所述主分组为当前图像所在的分组,所 述相邻分组为与所述主分组相似度最高的分组;所述相邻分组为一个或多个;
[0047] 针对每张图像,计算其颜色特征与其对应的主分组及相邻分组中其它图像的颜色 特征的相似度;
[0048] 在所述主分组及相邻分组中去除所述颜色特征的相似度小于第三预设门限值的 图像;
[0049] 针对当前图像,计算其梯度特征与其对应的主分组及相邻分组中剩余图像的梯度 特征的相似度;
[0050] 在所述主分组及相邻分组中进一步去除所述梯度特征的相似度小于第四预设门 限值的图像;
[0051] 针对当前图像,计算其局部特征与其对应的主分组及相邻分组中最后剩余的图像 的局部特征的相似度;
[0052] 将所述当前图像与其对应的主分组及相邻分组中最后剩余的图像的局部特征的 相似度作为所述图像的相似度。
[0053] 较佳地,所述按照所述相似度对所述图像进行聚类,形成一个或多个图像集合的 步骤包括:
[0054] 若所述图像的相似度高于第五预设门限值,则将所述图像放入同一图像集合。
[0055] 较佳地,所述的方法还包括:
[0056] 将同时出现在多个图像集合中的同一业务对象的图像进行去重处理。
[0057] 较佳地,所述将同时出现在多个图像集合中的同一业务对象的图像进行去重处理 的步骤包括:
[0058] 建立与每个图像集合对应的图像树,所述图像树的根节点设置为当前业务对象的 图像,所述图像树的叶子节点设置为所述图像集合的所有图像;
[0059] 遍历所述图像树的所有叶子节点,将所有叶子节点对应的图像树合并到当前图像 树中,消除被合并的图像树;
[0060] 遍历所有图像树,去除所有重复的业务对象的图像。
[0061] 本申请实施例公开了一种搜索方法,包括:
[0062] 接收用户的搜索请求;
[0063] 依据所述请求,获取搜索结果;及
[0064] 将所述搜索结果中具有相同的分类标识的业务对象合并为同款业务对象;
[0065] 其中,所述分类标识的生成方法包括:
[0066] 获取业务对象的图像;
[0067] 根据所述图像的视觉特征生成所述图像的数字签名;
[0068] 采用所述图像及其对应的数字签名建立图像签名库;依据所述数字签名将图像签 名库中的图像划分为多个分组;
[0069] 基于所述多个分组计算图像的相似度;
[0070] 按照所述相似度对所述图像进行聚类,形成一个或多个图像集合;
[0071] 将属于同一图像集合的图像对应的业务对象分配同一分类标识。
[0072] 较佳地,所述根据图像的视觉特征生成所述图像的数字签名的步骤包括:
[0073] 分别提取所述图像的视觉特征;所述视觉特征包括颜色特征,和/或,梯度特征, 和/或,局部特征;
[0074] 将所述视觉特征进行归一化,组合为对应图像的数字签名。
[0075] 较佳地,所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色 在当前图像中对应的像素点个数,当所述视觉特征包括颜色特征时,所述分别提取图像的 视觉特征的步骤包括:
[0076] 获得在预设颜色空间中量化的颜色维度;
[0077] 遍历所述图像中各像素点的颜色值,查找与所述各像素点的颜色值归属的颜色维 度;其中,所述各像素点的颜色值归属的颜色维度为与各像素点的颜色值距离最近的颜色 维度;
[0078] 统计各颜色维度在所述图像中对应的像素点个数,选择一个或多个像素点个数最 多的颜色维度作为当前图像的主颜色;
[0079] 获得所述主颜色在当前图像中对应的像素点个数;
[0080] 和 / 或,
[0081] 当所述视觉特征包括梯度特征时,所述分别提取图像的视觉特征的步骤包括:
[0082] 将所述图像转化为灰度图像,并对所述灰度图像进行平滑;
[0083] 依据所述平滑后的灰度图像计算所述图像的梯度方向直方图;
[0084] 采用所述梯度方向直方图及其对应的像素点个数作为当前图像的梯度特征;
[0085]和 / 或,
[0086] 当所述视觉特征包括局部特征时,所述分别提取图像的视觉特征的步骤包括:
[0087] 提取所述图像中具有旋转不变性和尺度不变性的特征点;
[0088] 计算所述特征点的对比度变量,选取对比度变量大于预设第一门限值的特征点拼 接成所述图像的局部特征。
[0089] 较佳地,所述分类标识的生成方法还包括:
[0090] 将同时出现在多个图像集合中的同一业务对象的图像进行去重处理。
[0091] 本申请实施例公开了一种同款业务对象聚合的系统,包括:
[0092] 图像获取模块,用于获取业务对象的图像;
[0093] 数字签名生成模块,用于根据所述图像的视觉特征生成所述图像的数字签名;
[0094] 图像签名库建立模块,用于采用所述图像及其对应的数字签名建立图像签名库;
[0095] 分组划分模块,用于依据所述数字签名将图像签名库中的图像划分为多个分组;
[0096] 相似度计算模块,用于基于所述多个分组计算所述图像的相似度;
[0097] 图像集合形成模块,用于按照所述相似度对所述图像进行聚类,形成一个或多个 图像集合;
[0098] 同款业务对象合并模块,用于将属于同一图像集合的图像对应的业务对象合并为 同款业务对象。
[0099] 较佳地,所述数字签名生成模块包括:
[0100] 视觉特征提取子模块,用于分别提取所述图像的视觉特征;所述视觉特征包括颜 色特征,和/或,梯度特征,和/或,局部特征;
[0101] 数字签名组合子模块,用于将所述视觉特征进行归一化,组合为对应图像的数字 签名。
[0102] 较佳地,所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色 在当前图像中对应的像素点个数,当所述视觉特征包括颜色特征时,所述视觉特征提取子 模块包括:
[0103] 颜色维度获得子模块,用于获得在预设颜色空间中量化的颜色维度;
[0104] 像素点归属查找子模块,用于遍历所述图像中各像素点的颜色值,查找与所述各 像素点的颜色值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像 素点的颜色值距离最近的颜色维度;
[0105] 主颜色生成子模块,用于统计各颜色维度在所述图像中对应的像素点个数,选择 一个或多个像素点个数最多的颜色维度作为当前图像的主颜色;
[0106] 像素点个数获取子模块,用于获得所述主颜色在当前图像中对应的像素点个数;
[0107] 和 / 或,
[0108] 当所述视觉特征包括梯度特征时,所述视觉特征提取子模块包括:
[0109] 灰度图像转换子模块,用于将所述图像转化为灰度图像,并对所述灰度图像进行 平滑;
[0110] 梯度方向直方图计算子模块,用于依据所述平滑后的灰度图像计算所述图像的梯 度方向直方图;
[0111] 梯度特征生成子模块,用于采用所述梯度方向直方图及其对应的像素点个数作为 当前图像的梯度特征;
[0112] 和 / 或,
[0113] 当所述视觉特征包括局部特征时,所述视觉特征提取子模块包括:
[0114] 特征点提取子模块,用于提取所述图像中具有旋转不变性和尺度不变性的特征 占.
[0115] 局部特征生成子模块,用于计算所述特征点的对比度变量,选取对比度变量大于 预设第一门限值的特征点拼接成所述图像的局部特征。
[0116] 较佳地,所述梯度方向直方图计算子模块进一步包括:
[0117] 梯度方向和梯度幅值计算子模块,用于针对平滑后的灰度图像,计算每一像素点 的梯度方向和梯度幅值;
[0118] 第一直方图生成子模块,用于对当前图像做梯度方向统计,生成当前图像的以梯 度方向为横轴的直方图;
[0119] 第二直方图生成子模块,用于将所述当前图像的梯度方向平均分成R个方向角 度,生成R个方向角度分别对应的R个直方图组距;其中,所述R为正整数;
[0120] 权重分配子模块,用于遍历图像中的所有像素点,分别根据每个像素点的梯度方 向找出最接近的两个方向角度对应的直方图组距,并根据接近程度从高到低分配权重系 数;
[0121] 权重累加子模块,用于将所述像素点的梯度幅值乘以权重系数分别累加至所述最 接近的两个方向角度对应的直方图组距中;
[0122] 梯度方向直方图生成子模块,用于进行归一化,生成当前图像的梯度方向直方图。
[0123] 较佳地,所述分组划分模块包括:
[0124] 颜色特征提取子模块,用于提取所述图像的数字签名中的颜色特征;
[0125] 主颜色选取子模块,用于从所述颜色特征中提取分组主颜色;其中,所述分组主颜 色包括最多像素点个数对应的主颜色;和/或,通过计算所述图像中最多像素点个数对应 的主颜色的像素点数量占所述图像所有像素点数量的比例,在所述比例大于第二预设门限 值时,所选取的对应像素点个数次多的主颜色;
[0126] 图像分组子模块,用于按照所述分组主颜色将所述图像划分为多个分组,同一分 组中图像的分组主颜色相同。
[0127] 较佳地,所述相似度计算模块包括:
[0128] 分组确定子模块,用于确定每张图像对应的主分组及相邻分组,所述主分组为当 前图像所在的分组,所述相邻分组为与所述主分组相似度最高的分组;所述相邻分组为一 个或多个;
[0129] 第一相似度计算子模块,用于针对每张图像,计算其颜色特征与其对应的主分组 及相邻分组中其它图像的颜色特征的相似度;
[0130] 第一图像去除子模块,用于在所述主分组及相邻分组中去除所述颜色特征的相似 度小于第三预设门限值的图像;
[0131] 第二相似度计算子模块,用于针对当前图像,计算其梯度特征与其对应的主分组 及相邻分组中剩余图像的梯度特征的相似度;
[0132] 第二图像去除子模块,用于在所述主分组及相邻分组中进一步去除所述梯度特征 的相似度小于第四预设门限值的图像;
[0133] 第三相似度计算子模块,用于针对当前图像,计算其局部特征与其对应的主分组 及相邻分组中最后剩余的图像的局部特征的相似度;
[0134] 相似度确定子模块,用于将所述当前图像与其对应的主分组及相邻分组中最后剩 余的图像的局部特征的相似度作为所述图像的相似度。
[0135] 较佳地,所述图像集合形成模块包括:
[0136] 图像放入子模块,用于当所述图像的相似度高于第五预设门限值时,将所述图像 放入同一图像集合。
[0137] 较佳地,所述的系统还包括:
[0138] 去重模块,用于将同时出现在多个图像集合中的同一业务对象的图像进行去重处 理。
[0139] 较佳地,所述去重模块包括:
[0140] 图像树建立子模块,用于建立与每个图像集合对应的图像树,所述图像树的根节 点设置为当前业务对象的图像,所述图像树的叶子节点设置为所述图像集合的所有图像;
[0141] 图像树合并子模块,用于遍历所述图像树的所有叶子节点,将所有叶子节点对应 的图像树合并到当前图像树中,消除被合并的图像树;
[0142] 图像树遍历子模块,用于遍历所有图像树,去除所有重复的业务对象的图像。
[0143] 本申请实施例公开了一种搜索系统,包括:
[0144] 请求接收模块,用于接收用户的搜索请求;
[0145] 搜索结果获取模块,用于依据所述请求,获取搜索结果;及
[0146] 搜索结果合并模块,用于将所述搜索结果中具有相同的分类标识的业务对象合并 为同款业务对象;
[0147] 其中,所述分类标识通过如下子模块生成:
[0148] 图像获取子模块,用于获取业务对象的图像;
[0149] 数字签名生成子模块,用于根据所述图像的视觉特征生成所述图像的数字签名;
[0150] 图像签名库建立子模块,用于采用所述图像及其对应的数字签名建立图像签名 库;
[0151] 分组划分子模块,用于依据所述数字签名将图像签名库中的图像划分为多个分 组;
[0152] 相似度计算子模块,用于基于所述多个分组计算所述图像的相似度;
[0153] 图像集合形成子模块,用于按照所述相似度对所述图像进行聚类,形成一个或多 个图像集合;
[0154] 同款业务对象合并子模块,用于将属于同一图像集合的图像对应的业务对象合并 为同款业务对象;
[0155] 分类标识分配子模块,用于将属于同一图像集合的图像对应的业务对象分配同一 分类标识。
[0156] 较佳地,所述数字签名生成子模块包括:
[0157] 视觉特征提取子模块,用于分别提取所述图像的视觉特征;所述视觉特征包括颜 色特征,和/或,梯度特征,和/或,局部特征;
[0158] 数字签名组合子模块,用于将所述视觉特征进行归一化,组合为对应图像的数字 签名。
[0159] 较佳地,所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色 在当前图像中对应的像素点个数,当所述视觉特征包括颜色特征时,所述视觉特征提取子 模块包括:
[0160] 颜色维度获得子模块,用于获得在预设颜色空间中量化的颜色维度;
[0161] 像素点归属查找子模块,用于遍历所述图像中各像素点的颜色值,查找与所述各 像素点的颜色值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像 素点的颜色值距离最近的颜色维度;
[0162] 主颜色生成子模块,用于统计各颜色维度在所述图像中对应的像素点个数,选择 一个或多个像素点个数最多的颜色维度作为当前图像的主颜色;
[0163] 像素点个数获取子模块,用于获得所述主颜色在当前图像中对应的像素点个数;
[0164] 和 / 或,
[0165] 当所述视觉特征包括梯度特征时,所述视觉特征提取子模块包括:
[0166] 灰度图像转换子模块,用于将所述图像转化为灰度图像,并对所述灰度图像进行 平滑;
[0167] 梯度方向直方图计算子模块,用于依据所述平滑后的灰度图像计算所述图像的梯 度方向直方图;
[0168] 梯度特征生成子模块,用于采用所述梯度方向直方图及其对应的像素点个数作为 当前图像的梯度特征;
[0169] 和 / 或,
[0170] 当所述视觉特征包括局部特征时,所述视觉特征提取子模块包括:
[0171] 特征点提取子模块,用于提取所述图像中具有旋转不变性和尺度不变性的特征 占.
[0172] 局部特征生成子模块,用于计算所述特征点的对比度变量,选取对比度变量大于 预设第一门限值的特征点拼接成所述图像的局部特征。
[0173] 较佳地,所述搜索结果合并模块还包括:
[0174] 去重子模块,用于将同时出现在多个图像集合中的同一业务对象的图像进行去重 处理。
[0175] 与【背景技术】相比,本申请实施例包括以下优点:
[0176] 本申请实施例提出了基于业务对象的图像内容生成对应数字签名的方案,该方案 通过提取图像中的一些显著的视觉特征,形成一定复杂度的信息组合,完成对图像内容的 抽象描述,生成具有代表性的作为该图像的鉴别标识;同时,根据所提取的视觉特征,制定 相对应的验证规则来判别不同签名间的重复度,识别正确率高,根据签名的匹配程度,将内 容相同或相似的图像聚合在一起,并进一步将同款业务对象聚合在一起,自动聚合,可行性 商。
[0177] 本申请实施例还提出了一种层次聚合方法。首先,根据图像视觉特征对待聚合的 图像进行分组,进行图像匹配时,对一张图像而言,只会将当前分组中和相邻分组中的图 像进行比较,极大的降低了图像匹配的次数;其次,进行图像匹配时,设计合理的层级处理 结构,按计算复杂性的大小,先易后难,即先考察相对简单的颜色,然后是复杂程度中等的 梯度特征,最后是较复杂的局部特征,逐层过滤相关度低的候选图像,最终精准定位内容相 同或相似的图像,聚合生成同款业务对象的图像集合。本申请实施例运算量小,适用于大规 模业务对象数据的处理,聚合效率高。
[0178] 对所有同款业务对象的图像集合再次进行聚合,根据同款业务对象的图像集合之 间的相关性生成最终的同款业务对象的图像聚合结果,去除重复的业务对象的图像,减少 数据冗余。

【专利附图】

【附图说明】
[0179] 图1示出了本申请的一种同款业务对象聚合的方法实施例1的步骤流程图;
[0180] 图2示出了本申请的一种同款业务对象聚合的方法实施例2的步骤流程图;
[0181] 图3示出了本申请的一种搜索方法实施例的步骤流程图;
[0182] 图4示出了本申请的一种同款业务对象聚合的系统实施例的结构框图;
[0183] 图5示出了本申请的一种搜索系统实施例的结构框图。

【具体实施方式】
[0184] 为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本申请作进一步详细的说明。
[0185] 本申请实施例的核心构思之一在于,提出一种反映图像内容的数字签名及对应的 验证规则,以便在进行搜索的时候,可以基于这个数字签名进行同款业务对象的快速准确 的聚合。
[0186] 参照图1,示出了本申请的一种同款业务对象聚合的方法实施例1的步骤流程图, 具体可以包括如下步骤:
[0187] 步骤101,获取业务对象的图像;
[0188] 需要说明的是,本申请实施例中的业务对象可以包括不同业务领域的具体事物。
[0189] 为使本领域技术人员更好地理解本申请实施例,在本说明书中,将商品作为业务 对象的一种示例进行说明。
[0190] 具体实现中,本申请实施例中的商品可以是由一个或多个网站主所展示的一款或 多款商品,所述商品的信息中可以包括一个或多个商品属性,例如商品图像、商品名称、商 品价格、商品描述、商品的型号、或商品的参数等。所谓同款商品,可以是由同一或不同网站 主所展示的商品属性完全或几乎相同的商品。
[0191] 步骤102,根据所述图像的视觉特征生成所述图像的数字签名;
[0192] 在本申请的一个优选实施例中,所述步骤102具体可以包括如下子步骤:
[0193] 子步骤S11,分别提取所述图像的视觉特征;所述视觉特征可以包括颜色特征,和 /或,梯度特征,和/或,局部特征;
[0194] 子步骤S12,将所述视觉特征进行归一化,组合为对应图像的数字签名。
[0195] 可以理解,所谓视觉特征,可以是具有直观意义的图像的形状与颜色等特征,则对 应生成的数字签名可以表征图像的内容。
[0196] 在本申请实施例的一个优选示例中,所述颜色特征包括针对每张图像的一个或多 个主颜色,以及,所述主颜色在当前图像中对应的像素点个数,当所述视觉特征包括颜色特 征时,所述子步骤S11具体可以包括如下子步骤:
[0197] 子步骤S11-11,获得在预设颜色空间中量化的颜色维度;
[0198] 例如,在红绿蓝RGB颜色空间中,一个像素点具有红R、绿G、蓝B三个颜色通道,每 种颜色的存储格式都是8位二位制数,即每个颜色通道就有2~8=256种亮度,一个像素点就 有256*256*256种颜色维度。由于维度太多,实际应用中难以统计分析,实用性低,因此需 要减少颜色维度。原本默认颜色通道的亮度步进为1,假设现在选择亮度步进为16,每个颜 色通道就有16种亮度,一个像素也就有16*16*16种颜色维度。
[0199] 子步骤S11-12,遍历所述图像中各像素点的颜色值,查找与所述各像素点的颜色 值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像素点的颜色值 距离最近的颜色维度;
[0200] 需要说明的是,所述的距离,可以包括但不限于欧氏距离。假如一个图像像素点的 颜色值为(130,234,111),那么其与均匀量化后颜色维度的欧式距离d=sqrt((130_R) ~2+( 234-6Γ2+(111-Β)~2),通过计算可以得到与其最近的颜色维度。
[0201] 子步骤S11-13,统计各颜色维度在所述图像中对应的像素点个数,选择一个或多 个像素点个数最多的颜色维度作为当前图像的主颜色;
[0202] 在本实施例的一个优选示例中,选取6个像素点个数最多的颜色维度作为当前图 像的主颜色。
[0203] 子步骤S11-14,获得所述主颜色在当前图像中对应的像素点个数。
[0204] 在具体实现中,根据所述主颜色及其对应的像素点个数生成颜色特征的方法并不 唯一,本申请实施例对此不加以限制。
[0205] 所述颜色特征可以描述当前图像的颜色分布。由于颜色特征主要是起到一个粗筛 的作用,所以务求在业务对象图像的处理过程中尽可能快捷,只需表征图像内容的大致信 息即可。
[0206] 在本申请的一个优选实施例中,当所述视觉特征包括梯度特征时,所述子步骤S11 具体还可以包括如下子步骤:
[0207] 子步骤S11-21,将所述图像转化为灰度图像,并对所述灰度图像进行平滑;
[0208] 在具体实现中,可以去除图像的噪声影响;所述进行平滑,可以包括但不限于使用 高斯平滑进行平滑处理。
[0209] 子步骤S11-22,依据所述平滑后的灰度图像计算所述图像的梯度方向直方图;
[0210] 在本实施例的一个优选示例中,所述子步骤S11-22进一步可以包括如下子步骤:
[0211] 子步骤C1,针对平滑后的灰度图像,计算每一像素点的梯度方向和梯度幅值;
[0212] 在具体实现中,可以包括但不限于使用一阶差分计算每一像素点的梯度方向和梯 度幅值。
[0213] 子步骤C2,对当前图像做梯度方向统计,生成当前图像的以梯度方向为横轴的直 方图;
[0214] 在具体实现中,梯度方向可以取0°到180°,也可以取0°到360°。
[0215] 子步骤C3,遍历图像中的所有像素点,分别根据每个像素点的梯度方向找出最接 近的两个方向角度对应的直方图组距,并根据接近程度从高到低分配权重系数;
[0216] 子步骤C4,遍历图像中的所有像素点,分别根据每个像素点的梯度方向找出最接 近的两个方向角度对应的直方图bin,并根据接近程度从高到低分配权重系数;
[0217] 在具体实现中,所述两个权重系数的和可以为1。
[0218] 子步骤C5,将将所述像素点的梯度幅值乘以权重系数分别累加至所述最接近的两 个方向角度对应的直方图组距中;
[0219] 在具体实现中,子步骤C4和C5是为了模糊不同直方图bin之间的边界效应。
[0220] 子步骤C6,进行归一化,生成当前图像的梯度方向直方图。
[0221] 在具体实现中,对当前图像中所有像素点进行C4和C5操作后,执行子步骤C6。
[0222] 子步骤S11-23,采用所述梯度方向直方图及其对应的像素点个数作为当前图像的 梯度特征;
[0223] 在具体实现中,所述生成梯度特征的方法并不唯一,本申请实施例对此不加以限 制。
[0224] 在本申请的一个优选实施例中,当所述视觉特征包括局部特征时,所述子步骤S11 具体还可以包括如下子步骤:
[0225] 子步骤S11-31,提取所述图像中具有旋转不变性和尺度不变性的特征点;
[0226] 在具体实现中,可以采用尺度不变特征转换SIFT作为局部描述子来描述图像的 局部特征。需要说明的是,对于本领域技术人员而言,利用SIFT方法计算得到图像中具有 旋转不变性和尺度不变性的特征点(即关键点),属于公知技术,本申请实施例在此不作详 细说明。SIFT特征点的数量可由本领域技术人员根据实际情况进行设定,本申请实施例对 此不加以限制。
[0227] 在本实施例的一个优选示例中,可以以每个关键点为中心,选取四周的64个像素 点,每相邻的4个像素为一像素组,共得到16个像素组,每个像素组再与关键点比较得到8 个坐标值,共得到128个坐标值,为该关键点的SIFT特征。SIFT特征从理论上来说是一种 相似不变量,对缩放、位移、旋转都不敏感,使得SIFT特征对图像的诸多变化具有了较强的 适应性。
[0228] 特征提取可以分为检测和描述两个阶段,以SIFT为例,SIFT特征点即特征检测的 结果,而上述128个坐标值的特征即为其对应SIFT特征点的描述。
[0229] 子步骤S11-32,计算所述特征点的对比度变量,选取对比度变量大于预设第一门 限值的特征点拼接成所述图像的局部特征。
[0230] 在本实施例的一个优选示例中,可以包括但不限于采取剪枝方法对SIFT特征点 进行选择。
[0231] 在本实施例的另一个优选示例中,所述第一预设门限值为100。
[0232] 局部特征抗干扰能力强,可以用于精准匹配。
[0233] 在具体实现中,所述根据特征点拼接生成局部特征的方法并不唯一,本申请实施 例对此不加以限制。
[0234] 当然,上述提取图像视觉特征的方法只是作为示例,在实施本申请实施例时,可以 根据实际情况设置其他提取图像视觉特征的方法,本申请实施例对此不加以限制。另外,除 了上述提取图像视觉特征的方法外,本领域技术人员还可以实际需要采用其它提取图像视 觉特征的方法,本申请实施例对此也不加以限制。
[0235] 采用图像视觉特征生成对应的数字签名的方式可由本领域技术人员根据实际情 况进行设定,可以是一个字符串,将颜色特征、梯度特征和局部特征中的一个或多个合并在 一起,一张图像对应一个字符串,也可以用二进制文件的方式存储数字签名,本申请实施例 对此不加以限制。
[0236] 步骤103,采用所述图像及其对应的数字签名建立图像签名库;
[0237] 在具体实现中,本申请实施例可以定时或不定时获取新的商品信息,基于商品对 应的图像生成对应的数字签名,添加到所述图像签名库中,本申请实施例对此不加以限制。
[0238] 步骤104,依据所述数字签名将图像签名库中的图像划分为多个分组;
[0239] 需要说明的是,进行分组的图像可以是图像签名库里的全部图像,也可以是图像 签名库里的部分图像,本申请实施例对此不加以限制。
[0240] 在本申请的一个优选实施例中,所述步骤104具体可以包括如下子步骤:
[0241] 子步骤S21,提取所述图像的数字签名中的颜色特征;
[0242] 需要说明的是,解析图像的数字签名的方法可以是与生成业务对象图像的数字签 名的方法相对应的。
[0243] 子步骤S22,从所述颜色特征中提取分组主颜色;其中,所述分组主颜色包括最多 像素点个数对应的主颜色;和/或,通过计算所述图像中最多像素点个数对应的主颜色的 像素点数量占所述图像所有像素点数量的比例,在所述比例大于第二预设门限值时,所选 取的对应像素点个数次多的主颜色;
[0244] 需要说明的是,次多可以是仅次于最多。
[0245] 在本实施例的一个优选示例中,所述第二预设门限值为0. 6?0. 8中的任一值。
[0246] 子步骤S23,按照所述分组主颜色将所述图像划分为多个分组,同一分组中图像的 分组主颜色相同。
[0247] 对图像进行分组,是对图像聚合的一个初步筛选,可以大大减少图像聚合过程中 的数据处理量。
[0248] 步骤105,基于所述多个分组计算所述图像的相似度;
[0249] 在本申请的一个优选实施例中,所述步骤105具体可以包括如下子步骤:
[0250] 子步骤S31,确定每张图像对应的主分组及相邻分组,所述主分组为当前图像所在 的分组,所述相邻分组为与所述主分组相似度最高的分组;所述相邻分组为一个或多个;
[0251] 可以理解,分组之间可以存在着排序的关系,分组越靠近,分组主颜色的相似度可 以越高,而相邻分组间的分组主颜色相似度可以是最高的。
[0252] 子步骤S32,针对每张图像,计算其颜色特征与其对应的主分组及相邻分组中其它 图像的颜色特征的相似度;
[0253] 可以理解,计算其中一张图像与其他图像的相似度,可以是计算所述图像与其所 在分组的其他图像的相似度、及所述图像与其他分组的图像的相似度。
[0254] 在本实施例的一个优选示例中,选择一个相邻分组进行图像相似度的计算。
[0255] 子步骤S33,在所述主分组及相邻分组中去除所述颜色特征的相似度小于第三预 设门限值的图像;
[0256] 去除可以代表所述的图像之间不存在相似度。
[0257] 在本实施例的一个优选示例中,所述第三预设门限值为0. 875。
[0258] 子步骤S34,针对当前图像,计算其梯度特征与其对应的主分组及相邻分组中剩余 图像的梯度特征的相似度;
[0259] 子步骤S35,在所述主分组及相邻分组中进一步去除所述梯度特征的相似度小于 第四预设门限值的图像;
[0260] 在本实施例的一个优选示例中,所述第四预设门限值为0. 925。
[0261] 子步骤S36,针对当前图像,计算其局部特征与其对应的主分组及相邻分组中最后 剩余的图像的局部特征的相似度;
[0262] 子步骤S37,将所述当前图像与其对应的主分组及相邻分组中最后剩余的图像的 局部特征的相似度作为所述图像的相似度。
[0263] 步骤106,按照所述相似度对所述图像进行聚类,形成一个或多个图像集合;
[0264] 在本申请的一个优选实施例中,所述步骤106具体可以包括如下子步骤:
[0265] 子步骤S41,若所述图像的相似度高于第五预设门限值,则将所述图像放入同一图 像集合。
[0266] 在本实施例的一个优选不例中,所述第五预设门限值为〇. 95。
[0267] 聚合后的结果,可以是每一张图像都会得到一个对应的图像集合。所述图像集合 里面的图像与当前图像在内容上实质相同。
[0268] 步骤107,将属于同一图像集合的图像对应的业务对象合并为同款业务对象。
[0269] 本申请实施例中,可以将同一图像集合的图像对应的商品合并为同款商品。
[0270] 参照图2,示出了本申请的一种同款业务对象聚合的方法实施例2的步骤流程图, 具体可以包括如下步骤:
[0271] 步骤201,获取业务对象的图像;
[0272] 步骤202,根据所述图像的视觉特征生成所述图像的数字签名;
[0273] 步骤203,采用所述图像及其对应的数字签名建立图像签名库;
[0274] 步骤204,依据所述数字签名将图像签名库中的图像划分为多个分组;
[0275] 步骤205,基于所述多个分组计算所述图像的相似度;
[0276] 步骤206,按照所述相似度对所述图像进行聚类,形成一个或多个图像集合;
[0277] 步骤207,将同时出现在多个图像集合中的同一业务对象的图像进行去重处理;
[0278] 步骤208,将属于同一图像集合的图像对应的业务对象合并为同款业务对象。
[0279] 本申请实施例中,所述商品经过聚合后,对于每张商品图像,都可以得到一个与所 述图像对应的图像集合,所述集合里的图像在内容实质上一样。但是在聚合结果中,不可避 免会出现同一商品的图像出现在多个图像集合中,为了减少数据冗余,需要对所有图像集 合进行去除重复商品图像的处理。
[0280] 在本申请的一个优选实施例中,所述步骤207具体可以包括如下子步骤:
[0281] 子步骤S51,建立与每个图像集合对应的图像树,所述图像树的根节点设置为当前 业务对象的图像,所述图像树的叶子节点设置为所述图像集合的所有图像;
[0282] 子步骤S52,遍历所述图像树的所有叶子节点,将所有叶子节点对应的图像树合并 到当前图像树中,消除被合并的图像树;
[0283] 子步骤S53,遍历所有图像树,去除所有重复的业务对象的图像。
[0284] 例如,商品图像M0的图像集合包括图像M1、M2和M3,分别建立M0、M1、M2、M3对应 的图像树!'0、1'1、了2、了3,其中1'0、1'1、了2、了3的根节点分别为勵、]?1、]\12、]\0,1'0的叶子节点 分别为Ml、M2和M3。遍历T0的叶子节点,Ml、M2和M3对应的图像树ΤΙ、T2和T3合并到 T0,即ΤΙ、T2、T3根节点以下的所有叶子节点连接到T0,结构保持不变,ΤΙ、T2、T3被删除。
[0285] 本申请实施例中,对所有的图像树进行上述操作,直到所有图像树都处理完毕。完 成去除重复业务对象图像处理后剩下的每一棵图像树,对应一个最终的同款商品的图像集 合,即内容实质上相同的图像的集合只剩下一个,对应的同款商品的集合也只剩下一个。
[0286] 参见图3,示出了本申请的一种搜索方法实施例的步骤流程图,具体可以包括如下 步骤:
[0287] 步骤301,接收用户的搜索请求;
[0288] 步骤302,依据所述请求,获取搜索结果;及
[0289] 步骤303,将所述搜索结果中具有相同的分类标识的业务对象合并为同款业务对 象;
[0290] 其中,所述分类标识的生成方法具体可以包括如下子步骤:
[0291] 子步骤S61,获取业务对象的图像;
[0292] 子步骤S62,根据所述图像的视觉特征生成所述图像的数字签名;
[0293] 子步骤S63,采用所述图像及其对应的数字签名建立图像签名库;依据所述数字 签名将图像签名库中的图像划分为多个分组;
[0294] 子步骤S64,基于所述多个分组计算图像的相似度;
[0295] 子步骤S65,按照所述相似度对所述图像进行聚类,形成一个或多个图像集合;
[0296] 子步骤S66,将属于同一图像集合的图像对应的业务对象分配同一分类标识。
[0297] 在本申请的一个优选实施例中,所述子步骤S62进一步可以包括如下子步骤:
[0298] 子步骤S62-1,分别提取所述图像的视觉特征;所述视觉特征包括颜色特征,和/ 或,梯度特征,和/或,局部特征;
[0299] 子步骤S62-2,将所述视觉特征进行归一化,组合为对应图像的数字签名。
[0300] 在本申请实施例的一个优选示例中,所述颜色特征包括针对每张图像的一个或多 个主颜色,以及,所述主颜色在当前图像中对应的像素点个数,当所述视觉特征包括颜色特 征时,所述子步骤S62-1具体可以包括如下子步骤:
[0301] 子步骤D1,获得在预设颜色空间中量化的颜色维度;
[0302] 子步骤D2,遍历所述图像中各像素点的颜色值,查找与所述各像素点的颜色值归 属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像素点的颜色值距离 最近的颜色维度;
[0303] 子步骤D3,统计各颜色维度在所述图像中对应的像素点个数,选择一个或多个像 素点个数最多的颜色维度作为当前图像的主颜色;
[0304] 子步骤D4,获得所述主颜色在当前图像中对应的像素点个数;
[0305] 在本申请实施例的一个优选示例中,当所述视觉特征包括梯度特征时,所述子步 骤S62-1具体还可以包括如下子步骤:
[0306] 子步骤E1,将所述图像转化为灰度图像,并对所述灰度图像进行平滑;
[0307] 子步骤E2,依据所述平滑后的灰度图像计算所述图像的梯度方向直方图;
[0308] 子步骤E3,采用所述梯度方向直方图及其对应的像素点个数作为当前图像的梯度 特征;
[0309] 在本申请实施例的一个优选示例中,当所述视觉特征包括局部特征时,所述子步 骤S62-1具体还可以包括如下子步骤:
[0310] 子步骤F1,提取所述图像中具有旋转不变性和尺度不变性的特征点;
[0311] 子步骤F2,计算所述特征点的对比度变量,选取对比度变量大于预设第一门限值 的特征点拼接成所述图像的局部特征。
[0312] 在本申请的一个优选实施例中,所述分类标识的生成方法具体还可以包括如下子 步骤:
[0313] 子步骤G1,将同时出现在多个图像集合中的同一业务对象的图像进行去重处理。
[0314] 在具体实现中,根据用户搜索商品请求,进行搜索,会得到一个传统的商品搜索结 果,即同款商品可能会被展现多次。本申请实施例可以基于此结果对所述商品图像进行聚 合,将商品搜索结果中同款商品合并为一个搜索结果展示给用户。无论是相同的网站主,还 是不同的网站主提供的商品,只要是同款商品,都会被聚合在一起,在搜索结果里做一次展 现,如果用户需要了解有哪些网站主提供这件商品的,则可以选择所述商品再去聚合结果 内部查询。
[0315] 可以理解,不同的商品图像集合可以有不同的分类标识,商品图像集合里的所有 商品图像的分类标识可以是统一的。在为商品图像集合里的商品图像配置统一的分类标识 后,再次接收用户的搜索商品请求进行搜索,并得到传统的搜索结果后,可以通过辨识商品 图像的分类标识,能快速将标识相同的商品图像聚合为同款商品集合,而不用再根据其数 字签名进行聚合,节省了系统资源和缩小了聚合时间。
[0316] 此外,本申请实施例还可以依据预设的时间规则对新添加的商品进行聚合,将其 归入相应的同款商品集合,并配置相应的标识。
[0317] 其中,所述时间规则可由本领域技术人员根据实际情况进行设定,可以是不定时 对新添加的业务对象进行聚合,例如在夜晚等繁忙时段每2小时对新添加的业务对象进行 聚合、而在凌晨等空闲时段每6小时对新添加的业务对象进行聚合,也可以是周期性的对 新添加的业务对象进行聚合等等,本申请实施例对此不加以限制。
[0318] 对于本申请实施例而言,由于获取分类标识的方法实施例与同款业务对象聚合的 方法实施例基本相似,本申请实施例在此不再详述,相关之处参见同款业务对象聚合的方 法实施例的部分说明即可。
[0319] 可以理解,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合, 但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据 本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知 悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请 实施例所必须的。
[0320] 参照图4,示出了本申请实施例的一种同款同款业务聚合的系统实施例的结构框 图,具体可以包括以下模块:
[0321] 图像获取模块401,用于获取业务对象的图像;
[0322] 数字签名生成模块402,用于根据所述图像的视觉特征生成所述图像的数字签 名;
[0323] 图像签名库建立模块403,用于采用所述图像及其对应的数字签名建立图像签名 库;
[0324] 分组划分模块404,用于依据所述数字签名将图像签名库中的图像划分为多个分 组;
[0325] 相似度计算模块405,用于基于所述多个分组计算所述图像的相似度;
[0326] 图像集合形成模块406,用于按照所述相似度对所述图像进行聚类,形成一个或多 个图像集合;
[0327] 同款业务对象合并模块407,用于将属于同一图像集合的图像对应的业务对象合 并为同款业务对象。
[0328] 在本申请的一个优选实施例中,所述数字签名生成模块包括:所述视觉特征包括 颜色特征,和/或,梯度特征,和/或,局部特征;
[0329] 视觉特征提取子模块,用于分别提取所述图像的视觉特征;
[0330] 数字签名组合子模块,用于将所述视觉特征进行归一化,组合为对应图像的数字 签名。
[0331] 在本申请的一个优选实施例中,所述颜色特征包括针对每张图像的一个或多个主 颜色,以及,所述主颜色在当前图像中对应的像素点个数,当所述视觉特征包括颜色特征 时,所述视觉特征提取子模块包括:
[0332] 颜色维度获得子模块,用于获得在预设颜色空间中量化的颜色维度;
[0333] 像素点归属查找子模块,用于遍历所述图像中各像素点的颜色值,查找与所述各 像素点的颜色值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像 素点的颜色值距离最近的颜色维度;
[0334] 主颜色生成子模块,用于统计各颜色维度在所述图像中对应的像素点个数,选择 一个或多个像素点个数最多的颜色维度作为当前图像的主颜色;
[0335] 像素点个数获取子模块,用于获得所述主颜色在当前图像中对应的像素点个数;
[0336] 和 / 或,
[0337] 当所述视觉特征包括梯度特征时,所述视觉特征提取子模块包括:
[0338] 灰度图像转换子模块,用于将所述图像转化为灰度图像,并对所述灰度图像进行 平滑;
[0339] 梯度方向直方图计算子模块,用于依据所述平滑后的灰度图像计算所述图像的梯 度方向直方图;
[0340] 梯度特征生成子模块,用于采用所述梯度方向直方图及其对应的像素点个数作为 当前图像的梯度特征;
[0341] 和 / 或,
[0342] 当所述视觉特征包括局部特征时,所述视觉特征提取子模块包括:
[0343] 特征点提取子模块,用于提取所述图像中具有旋转不变性和尺度不变性的特征 占.
[0344] 局部特征生成子模块,用于计算所述特征点的对比度变量,选取对比度变量大于 预设第一门限值的特征点拼接成所述图像的局部特征。
[0345] 在本申请的一个优选实施例中,所述梯度方向直方图计算子模块进一步包括:
[0346] 梯度方向和梯度幅值计算子模块,用于针对平滑后的灰度图像,计算每一像素点 的梯度方向和梯度幅值;
[0347] 第一直方图生成子模块,用于对当前图像做梯度方向统计,生成当前图像的以梯 度方向为横轴的直方图;
[0348] 第二直方图生成子模块,用于将所述当前图像的梯度方向平均分成R个方向角 度,生成R个方向角度分别对应的R个直方图组距;其中,所述R为正整数;
[0349] 权重分配子模块,用于遍历图像中的所有像素点,分别根据每个像素点的梯度方 向找出最接近的两个方向角度对应的直方图组距,并根据接近程度从高到低分配权重系 数;
[0350] 权重累加子模块,用于将所述像素点的梯度幅值乘以权重系数分别累加至所述最 接近的两个方向角度对应的直方图组距中;
[0351] 梯度方向直方图生成子模块,用于进行归一化,生成当前图像的梯度方向直方图。
[0352] 在本申请的一个优选实施例中,所述分组划分模块包括:
[0353] 颜色特征提取子模块,用于提取所述图像的数字签名中的颜色特征;
[0354] 主颜色选取子模块,用于从所述颜色特征中提取分组主颜色;其中,所述分组主颜 色包括最多像素点个数对应的主颜色;和/或,通过计算所述图像中最多像素点个数对应 的主颜色的像素点数量占所述图像所有像素点数量的比例,在所述比例大于第二预设门限 值时,所选取的对应像素点个数次多的主颜色;
[0355] 图像分组子模块,用于按照所述分组主颜色将所述图像划分为多个分组,同一分 组中图像的分组主颜色相同。
[0356] 在本申请的一个优选实施例中,所述相似度计算模块包括:
[0357] 分组确定子模块,用于确定每张图像对应的主分组及相邻分组,所述主分组为当 前图像所在的分组,所述相邻分组为与所述主分组相似度最高的分组;所述相邻分组为一 个或多个;
[0358] 第一相似度计算子模块,用于针对每张图像,计算其颜色特征与其对应的主分组 及相邻分组中其它图像的颜色特征的相似度;
[0359] 第一图像去除子模块,用于在所述主分组及相邻分组中去除所述颜色特征的相似 度小于第三预设门限值的图像;
[0360] 第二相似度计算子模块,用于针对当前图像,计算其梯度特征与其对应的主分组 及相邻分组中剩余图像的梯度特征的相似度;
[0361] 第二图像去除子模块,用于在所述主分组及相邻分组中进一步去除所述梯度特征 的相似度小于第四预设门限值的图像;
[0362] 第三相似度计算子模块,用于针对当前图像,计算其局部特征与其对应的主分组 及相邻分组中最后剩余的图像的局部特征的相似度;相似度确定子模块,用于将所述当前 图像与其对应的主分组及相邻分组中最后剩余的图像的局部特征的相似度作为所述图像 的相似度。
[0363] 在本申请的一个优选实施例中,所述图像集合形成模块包括:
[0364] 图像放入子模块,用于当所述图像的相似度高于第五预设门限值时,将所述图像 放入同一图像集合。
[0365] 在本申请的一个优选实施例中,所述的系统还包括:
[0366] 去重模块,用于将同时出现在多个图像集合中的同一业务对象的图像进行去重处 理。
[0367] 在本申请的一个优选实施例中,所述去重模块包括:
[0368] 图像树建立子模块,用于建立与每个图像集合对应的图像树,所述图像树的根节 点设置为当前业务对象的图像,所述图像树的叶子节点设置为所述图像集合的所有图像;
[0369] 图像树合并子模块,用于遍历所述图像树的所有叶子节点,将所有叶子节点对应 的图像树合并到当前图像树中,消除被合并的图像树;
[0370] 图像树遍历子模块,用于遍历所有图像树,去除所有重复的业务对象的图像。
[0371] 可以理解,对于同款业务对象聚合的系统实施例而言,由于其与同款同款业务聚 合的方法实施例基本相似,所以描述的比较简单,相关之处参见同款同款业务聚合的方法 实施例的部分说明即可。
[0372] 参见图5,示出了本申请的一种搜索系统实施例的结构框图,具体可以包括如下模 块:
[0373] 请求接收模块501,用于接收用户的搜索请求;
[0374] 搜索结果获取模块502,用于依据所述请求,获取搜索结果;及
[0375] 搜索结果合并模块503,用于将所述搜索结果中具有相同的分类标识的业务对象 合并为同款业务对象;
[0376] 其中,所述分类标识通过如下子模块生成:
[0377] 图像获取子模块,用于获取业务对象的图像;
[0378] 数字签名生成子模块,用于根据所述图像的视觉特征生成所述图像的数字签名;
[0379] 图像签名库建立子模块,用于采用所述图像及其对应的数字签名建立图像签名 库;
[0380] 分组划分子模块,用于依据所述数字签名将图像签名库中的图像划分为多个分 组;
[0381] 相似度计算子模块,用于基于所述多个分组计算所述图像的相似度;
[0382] 图像集合形成子模块,用于按照所述相似度对所述图像进行聚类,形成一个或多 个图像集合;
[0383] 同款业务对象合并子模块,用于将属于同一图像集合的图像对应的业务对象合并 为同款业务对象;
[0384] 分类标识分配子模块,用于将属于同一图像集合的图像对应的业务对象分配同一 分类标识。
[0385] 在本申请的一个优选实施例中,所述数字签名生成子模块包括:
[0386] 视觉特征提取子模块,用于分别提取所述图像的视觉特征;所述视觉特征包括颜 色特征,和/或,梯度特征,和/或,局部特征;
[0387] 数字签名组合子模块,用于将所述视觉特征进行归一化,组合为对应图像的数字 签名。
[0388] 在本申请的一个优选实施例中,所述颜色特征包括针对每张图像的一个或多个主 颜色,以及,所述主颜色在当前图像中对应的像素点个数,当所述视觉特征包括颜色特征 时,所述视觉特征提取子模块包括:
[0389] 颜色维度获得子模块,用于获得在预设颜色空间中量化的颜色维度;
[0390] 像素点归属查找子模块,用于遍历所述图像中各像素点的颜色值,查找与所述各 像素点的颜色值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像 素点的颜色值距离最近的颜色维度;
[0391] 主颜色生成子模块,用于统计各颜色维度在所述图像中对应的像素点个数,选择 一个或多个像素点个数最多的颜色维度作为当前图像的主颜色;
[0392] 像素点个数获取子模块,用于获得所述主颜色在当前图像中对应的像素点个数;
[0393] 和 / 或,
[0394] 当所述视觉特征包括梯度特征时,所述视觉特征提取子模块包括:
[0395] 灰度图像转换子模块,用于将所述图像转化为灰度图像,并对所述灰度图像进行 平滑;
[0396] 梯度方向直方图计算子模块,用于依据所述平滑后的灰度图像计算所述图像的梯 度方向直方图;
[0397] 梯度特征生成子模块,用于采用所述梯度方向直方图及其对应的像素点个数作为 当前图像的梯度特征;
[0398] 和 / 或,
[0399] 当所述视觉特征包括局部特征时,所述视觉特征提取子模块包括:
[0400] 特征点提取子模块,用于提取所述图像中具有旋转不变性和尺度不变性的特征 占 .
[0401] 局部特征生成子模块,用于计算所述特征点的对比度变量,选取对比度变量大于 预设第一门限值的特征点拼接成所述图像的局部特征。
[0402] 在本申请的一个优选实施例中,所述搜索结果合并模块还包括:
[0403] 去重子模块,用于将同时出现在多个图像集合中的同一业务对象的图像进行去重 处理。
[0404] 可以理解,对于搜索系统实施例而言,由于其与搜索方法实施例基本相似,所以描 述的比较简单,相关之处参见搜索方法实施例的部分说明即可。
[0405] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0406] 本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、系统、或计算 机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和 硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可 用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上 实施的计算机程序产品的形式。
[0407] 在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出 接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储 器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是 计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体 可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模 块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取 存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储 器(ROM)、电可擦除可编程只读存储器(EEPR0M)、快闪记忆体或其他内存技术、只读光盘只 读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储 或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按 照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitory media), 如调制的数据信号和载波。
[0408] 本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序 产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框 图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提 供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理 终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处 理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多 个方框中指定的功能的装置。
[0409] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备 以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包 括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方 框或多个方框中指定的功能。
[0410] 这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得 在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在 计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程 和/或方框图一个方框或多个方框中指定的功能的步骤。
[0411] 尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基 本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为 包括优选实施例以及落入本申请实施例范围的所有变更和修改。
[0412] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将 一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作 之间存在任何这种实际的关系或者顺序。而且,术语"包括"、"包含"或者其任何其他变体 意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅 包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物 品或者终端设备所固有的要素。在没有更多限制的情况下,由语句"包括一个......"限定 的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要 素。
[0413] 以上对本申请所提供的一种同款业务对象聚合的方法、一种同款业务对象聚合的 系统、一种搜索方法和一种搜索系统,进行了详细介绍,本文中应用了具体个例对本申请的 原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心 思想;同时,对于本领域的一般技术人员,依据本申请的思想,在【具体实施方式】及应用范围 上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
【权利要求】
1. 一种同款业务对象聚合的方法,其特征在于,包括: 获取业务对象的图像; 根据所述图像的视觉特征生成所述图像的数字签名; 采用所述图像及其对应的数字签名建立图像签名库; 依据所述数字签名将图像签名库中的图像划分为多个分组; 基于所述多个分组计算所述图像的相似度; 按照所述相似度对所述图像进行聚类,形成一个或多个图像集合; 将属于同一图像集合的图像对应的业务对象合并为同款业务对象。
2. 根据权利要求1所述的方法,其特征在于,所述根据图像的视觉特征生成所述图像 的数字签名的步骤包括: 分别提取所述图像的视觉特征;所述视觉特征包括颜色特征,和/或,梯度特征,和/ 或,局部特征; 将所述视觉特征进行归一化,组合为对应图像的数字签名。
3. 根据权利要求2所述的方法,其特征在于, 所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色在当前图像 中对应的像素点个数,当所述视觉特征包括颜色特征时,所述分别提取图像的视觉特征的 步骤包括: 获得在预设颜色空间中量化的颜色维度; 遍历所述图像中各像素点的颜色值,查找与所述各像素点的颜色值归属的颜色维度; 其中,所述各像素点的颜色值归属的颜色维度为与各像素点的颜色值距离最近的颜色维 度; 统计各颜色维度在所述图像中对应的像素点个数,选择一个或多个像素点个数最多的 颜色维度作为当前图像的主颜色; 获得所述主颜色在当前图像中对应的像素点个数; 和/或, 当所述视觉特征包括梯度特征时,所述分别提取图像的视觉特征的步骤包括: 将所述图像转化为灰度图像,并对所述灰度图像进行平滑; 依据所述平滑后的灰度图像计算所述图像的梯度方向直方图; 采用所述梯度方向直方图及其对应的像素点个数作为当前图像的梯度特征; 和/或, 当所述视觉特征包括局部特征时,所述分别提取图像的视觉特征的步骤包括: 提取所述图像中具有旋转不变性和尺度不变性的特征点; 计算所述特征点的对比度变量,选取对比度变量大于预设第一门限值的特征点拼接成 所述图像的局部特征。
4. 根据权利要求3所述的方法,其特征在于,所述依据平滑后的灰度图像计算所述图 像的梯度方向直方图的子步骤进一步包括: 针对平滑后的灰度图像,计算每一像素点的梯度方向和梯度幅值; 对当前图像做梯度方向统计,生成当前图像的以梯度方向为横轴的直方图; 将所述当前图像的梯度方向平均分成R个方向角度,生成R个方向角度分别对应的R 个直方图组距;其中,所述R为正整数; 遍历图像中的所有像素点,分别根据每个像素点的梯度方向找出最接近的两个方向角 度对应的直方图组距,并根据接近程度从高到低分配权重系数; 将所述像素点的梯度幅值乘以权重系数分别累加至所述最接近的两个方向角度对应 的直方图组距中; 进行归一化,生成当前图像的梯度方向直方图。
5. 根据权利要求3或4所述的方法,其特征在于,所述依据数字签名将图像签名库中的 图像划分为多个分组的步骤包括: 提取所述图像的数字签名中的颜色特征; 从所述颜色特征中提取分组主颜色;其中,所述分组主颜色包括最多像素点个数对应 的主颜色;和/或,通过计算所述图像中最多像素点个数对应的主颜色的像素点数量占所 述图像所有像素点数量的比例,在所述比例大于第二预设门限值时,所选取的对应像素点 个数次多的主颜色; 按照所述分组主颜色将所述图像划分为多个分组,同一分组中图像的分组主颜色相 同。
6. 根据权利要求5所述的方法,其特征在于,所述基于多个分组计算所述图像的相似 度的步骤包括: 确定每张图像对应的主分组及相邻分组,所述主分组为当前图像所在的分组,所述相 邻分组为与所述主分组相似度最高的分组;所述相邻分组为一个或多个; 针对每张图像,计算其颜色特征与其对应的主分组及相邻分组中其它图像的颜色特征 的相似度; 在所述主分组及相邻分组中去除所述颜色特征的相似度小于第三预设门限值的图 像; 针对当前图像,计算其梯度特征与其对应的主分组及相邻分组中剩余图像的梯度特征 的相似度; 在所述主分组及相邻分组中进一步去除所述梯度特征的相似度小于第四预设门限值 的图像; 针对当前图像,计算其局部特征与其对应的主分组及相邻分组中最后剩余的图像的局 部特征的相似度; 将所述当前图像与其对应的主分组及相邻分组中最后剩余的图像的局部特征的相似 度作为所述图像的相似度。
7. 根据权利要求6所述的方法,其特征在于,所述按照所述相似度对所述图像进行聚 类,形成一个或多个图像集合的步骤包括: 若所述图像的相似度高于第五预设门限值,则将所述图像放入同一图像集合。
8. 根据权利要求1所述的方法,其特征在于,所述的方法还包括: 将同时出现在多个图像集合中的同一业务对象的图像进行去重处理。
9. 根据权利要求8所述的方法,其特征在于,所述将同时出现在多个图像集合中的同 一业务对象的图像进行去重处理的步骤包括: 建立与每个图像集合对应的图像树,所述图像树的根节点设置为当前业务对象的图 像,所述图像树的叶子节点设置为所述图像集合的所有图像; 遍历所述图像树的所有叶子节点,将所有叶子节点对应的图像树合并到当前图像树 中,消除被合并的图像树; 遍历所有图像树,去除所有重复的业务对象的图像。
10. -种搜索方法,其特征在于,包括: 接收用户的搜索请求; 依据所述请求,获取搜索结果;及 将所述搜索结果中具有相同的分类标识的业务对象合并为同款业务对象; 其中,所述分类标识的生成方法包括: 获取业务对象的图像; 根据所述图像的视觉特征生成所述图像的数字签名; 采用所述图像及其对应的数字签名建立图像签名库;依据所述数字签名将图像签名库 中的图像划分为多个分组; 基于所述多个分组计算图像的相似度; 按照所述相似度对所述图像进行聚类,形成一个或多个图像集合; 将属于同一图像集合的图像对应的业务对象分配同一分类标识。
11. 根据权利要求10所述的方法,其特征在于,所述根据图像的视觉特征生成所述图 像的数字签名的步骤包括: 分别提取所述图像的视觉特征;所述视觉特征包括颜色特征,和/或,梯度特征,和/ 或,局部特征; 将所述视觉特征进行归一化,组合为对应图像的数字签名。
12. 根据权利要求11所述的方法,其特征在于, 所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色在当前图像 中对应的像素点个数,当所述视觉特征包括颜色特征时,所述分别提取图像的视觉特征的 步骤包括: 获得在预设颜色空间中量化的颜色维度; 遍历所述图像中各像素点的颜色值,查找与所述各像素点的颜色值归属的颜色维度; 其中,所述各像素点的颜色值归属的颜色维度为与各像素点的颜色值距离最近的颜色维 度; 统计各颜色维度在所述图像中对应的像素点个数,选择一个或多个像素点个数最多的 颜色维度作为当前图像的主颜色; 获得所述主颜色在当前图像中对应的像素点个数; 和/或, 当所述视觉特征包括梯度特征时,所述分别提取图像的视觉特征的步骤包括: 将所述图像转化为灰度图像,并对所述灰度图像进行平滑; 依据所述平滑后的灰度图像计算所述图像的梯度方向直方图; 采用所述梯度方向直方图及其对应的像素点个数作为当前图像的梯度特征; 和/或, 当所述视觉特征包括局部特征时,所述分别提取图像的视觉特征的步骤包括: 提取所述图像中具有旋转不变性和尺度不变性的特征点; 计算所述特征点的对比度变量,选取对比度变量大于预设第一门限值的特征点拼接成 所述图像的局部特征。
13. 根据权利要求10所述的方法,其特征在于,所述分类标识的生成方法还包括: 将同时出现在多个图像集合中的同一业务对象的图像进行去重处理。
14. 一种同款业务对象聚合的系统,其特征在于,包括: 图像获取模块,用于获取业务对象的图像; 数字签名生成模块,用于根据所述图像的视觉特征生成所述图像的数字签名; 图像签名库建立模块,用于采用所述图像及其对应的数字签名建立图像签名库; 分组划分模块,用于依据所述数字签名将图像签名库中的图像划分为多个分组; 相似度计算模块,用于基于所述多个分组计算所述图像的相似度; 图像集合形成模块,用于按照所述相似度对所述图像进行聚类,形成一个或多个图像 集合; 同款业务对象合并模块,用于将属于同一图像集合的图像对应的业务对象合并为同款 业务对象。
15. 根据权利要求14所述的系统,其特征在于,所述数字签名生成模块包括: 视觉特征提取子模块,用于分别提取所述图像的视觉特征;所述视觉特征包括颜色特 征,和/或,梯度特征,和/或,局部特征; 数字签名组合子模块,用于将所述视觉特征进行归一化,组合为对应图像的数字签名。
16. 根据权利要求15所述的系统,其特征在于, 所述颜色特征包括针对每张图像的一个或多个主颜色,以及,所述主颜色在当前图像 中对应的像素点个数,当所述视觉特征包括颜色特征时,所述视觉特征提取子模块包括: 颜色维度获得子模块,用于获得在预设颜色空间中量化的颜色维度; 像素点归属查找子模块,用于遍历所述图像中各像素点的颜色值,查找与所述各像素 点的颜色值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像素点 的颜色值距离最近的颜色维度; 主颜色生成子模块,用于统计各颜色维度在所述图像中对应的像素点个数,选择一个 或多个像素点个数最多的颜色维度作为当前图像的主颜色; 像素点个数获取子模块,用于获得所述主颜色在当前图像中对应的像素点个数; 和/或, 当所述视觉特征包括梯度特征时,所述视觉特征提取子模块包括: 灰度图像转换子模块,用于将所述图像转化为灰度图像,并对所述灰度图像进行平 滑; 梯度方向直方图计算子模块,用于依据所述平滑后的灰度图像计算所述图像的梯度方 向直方图; 梯度特征生成子模块,用于采用所述梯度方向直方图及其对应的像素点个数作为当前 图像的梯度特征; 和/或, 当所述视觉特征包括局部特征时,所述视觉特征提取子模块包括: 特征点提取子模块,用于提取所述图像中具有旋转不变性和尺度不变性的特征点; 局部特征生成子模块,用于计算所述特征点的对比度变量,选取对比度变量大于预设 第一门限值的特征点拼接成所述图像的局部特征。
17. 根据权利要求16所述的系统,其特征在于,所述梯度方向直方图计算子模块进一 步包括: 梯度方向和梯度幅值计算子模块,用于针对平滑后的灰度图像,计算每一像素点的梯 度方向和梯度幅值; 第一直方图生成子模块,用于对当前图像做梯度方向统计,生成当前图像的以梯度方 向为横轴的直方图; 第二直方图生成子模块,用于将所述当前图像的梯度方向平均分成R个方向角度,生 成R个方向角度分别对应的R个直方图组距;其中,所述R为正整数; 权重分配子模块,用于遍历图像中的所有像素点,分别根据每个像素点的梯度方向找 出最接近的两个方向角度对应的直方图组距,并根据接近程度从高到低分配权重系数; 权重累加子模块,用于将所述像素点的梯度幅值乘以权重系数分别累加至所述最接近 的两个方向角度对应的直方图组距中; 梯度方向直方图生成子模块,用于进行归一化,生成当前图像的梯度方向直方图。
18. 根据权利要求16或17所述的系统,其特征在于,所述分组划分模块包括: 颜色特征提取子模块,用于提取所述图像的数字签名中的颜色特征; 主颜色选取子模块,用于从所述颜色特征中提取分组主颜色;其中,所述分组主颜色 包括最多像素点个数对应的主颜色;和/或,通过计算所述图像中最多像素点个数对应的 主颜色的像素点数量占所述图像所有像素点数量的比例,在所述比例大于第二预设门限值 时,所选取的对应像素点个数次多的主颜色; 图像分组子模块,用于按照所述分组主颜色将所述图像划分为多个分组,同一分组中 图像的分组主颜色相同。
19. 根据权利要求18所述的系统,其特征在于,所述相似度计算模块包括: 分组确定子模块,用于确定每张图像对应的主分组及相邻分组,所述主分组为当前图 像所在的分组,所述相邻分组为与所述主分组相似度最高的分组;所述相邻分组为一个或 多个; 第一相似度计算子模块,用于针对每张图像,计算其颜色特征与其对应的主分组及相 邻分组中其它图像的颜色特征的相似度; 第一图像去除子模块,用于在所述主分组及相邻分组中去除所述颜色特征的相似度小 于第三预设门限值的图像; 第二相似度计算子模块,用于针对当前图像,计算其梯度特征与其对应的主分组及相 邻分组中剩余图像的梯度特征的相似度; 第二图像去除子模块,用于在所述主分组及相邻分组中进一步去除所述梯度特征的相 似度小于第四预设门限值的图像; 第三相似度计算子模块,用于针对当前图像,计算其局部特征与其对应的主分组及相 邻分组中最后剩余的图像的局部特征的相似度; 相似度确定子模块,用于将所述当前图像与其对应的主分组及相邻分组中最后剩余的 图像的局部特征的相似度作为所述图像的相似度。
20. 根据权利要求19所述的系统,其特征在于,所述图像集合形成模块包括: 图像放入子模块,用于当所述图像的相似度高于第五预设门限值时,将所述图像放入 同一图像集合。
21. 根据权利要求14所述的系统,其特征在于,所述的系统还包括: 去重模块,用于将同时出现在多个图像集合中的同一业务对象的图像进行去重处理。
22. 根据权利要求21所述的系统,其特征在于,所述去重模块包括: 图像树建立子模块,用于建立与每个图像集合对应的图像树,所述图像树的根节点设 置为当前业务对象的图像,所述图像树的叶子节点设置为所述图像集合的所有图像; 图像树合并子模块,用于遍历所述图像树的所有叶子节点,将所有叶子节点对应的图 像树合并到当前图像树中,消除被合并的图像树; 图像树遍历子模块,用于遍历所有图像树,去除所有重复的业务对象的图像。
23. -种搜索系统,其特征在于,包括: 请求接收模块,用于接收用户的搜索请求; 搜索结果获取模块,用于依据所述请求,获取搜索结果;及 搜索结果合并模块,用于将所述搜索结果中具有相同的分类标识的业务对象合并为同 款业务对象; 其中,所述分类标识通过如下子模块生成: 图像获取子模块,用于获取业务对象的图像; 数字签名生成子模块,用于根据所述图像的视觉特征生成所述图像的数字签名; 图像签名库建立子模块,用于采用所述图像及其对应的数字签名建立图像签名库; 分组划分子模块,用于依据所述数字签名将图像签名库中的图像划分为多个分组; 相似度计算子模块,用于基于所述多个分组计算所述图像的相似度; 图像集合形成子模块,用于按照所述相似度对所述图像进行聚类,形成一个或多个图 像集合; 同款业务对象合并子模块,用于将属于同一图像集合的图像对应的业务对象合并为同 款业务对象; 分类标识分配子模块,用于将属于同一图像集合的图像对应的业务对象分配同一分类 标识。
24. 根据权利要求23所述的系统,其特征在于,所述数字签名生成子模块包括: 视觉特征提取子模块,用于分别提取所述图像的视觉特征;所述视觉特征包括颜色特 征,和/或,梯度特征,和/或,局部特征; 数字签名组合子模块,用于将所述视觉特征进行归一化,组合为对应图像的数字签名。
25. 根据权利要求24所述的系统,其特征在于,所述颜色特征包括针对每张图像的一 个或多个主颜色,以及,所述主颜色在当前图像中对应的像素点个数,当所述视觉特征包括 颜色特征时,所述视觉特征提取子模块包括: 颜色维度获得子模块,用于获得在预设颜色空间中量化的颜色维度; 像素点归属查找子模块,用于遍历所述图像中各像素点的颜色值,查找与所述各像素 点的颜色值归属的颜色维度;其中,所述各像素点的颜色值归属的颜色维度为与各像素点 的颜色值距离最近的颜色维度; 主颜色生成子模块,用于统计各颜色维度在所述图像中对应的像素点个数,选择一个 或多个像素点个数最多的颜色维度作为当前图像的主颜色; 像素点个数获取子模块,用于获得所述主颜色在当前图像中对应的像素点个数; 和/或, 当所述视觉特征包括梯度特征时,所述视觉特征提取子模块包括: 灰度图像转换子模块,用于将所述图像转化为灰度图像,并对所述灰度图像进行平 滑; 梯度方向直方图计算子模块,用于依据所述平滑后的灰度图像计算所述图像的梯度方 向直方图; 梯度特征生成子模块,用于采用所述梯度方向直方图及其对应的像素点个数作为当前 图像的梯度特征; 和/或, 当所述视觉特征包括局部特征时,所述视觉特征提取子模块包括: 特征点提取子模块,用于提取所述图像中具有旋转不变性和尺度不变性的特征点; 局部特征生成子模块,用于计算所述特征点的对比度变量,选取对比度变量大于预设 第一门限值的特征点拼接成所述图像的局部特征。
26.根据权利要求23所述的系统,其特征在于,所述搜索结果合并模块还包括: 去重子模块,用于将同时出现在多个图像集合中的同一业务对象的图像进行去重处 理。
【文档编号】G06K9/62GK104142946SQ201310167405
【公开日】2014年11月12日 申请日期:2013年5月8日 优先权日:2013年5月8日
【发明者】邓宇, 欧海峰 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1