商标图像检索方法

文档序号:6638007阅读:686来源:国知局
商标图像检索方法
【专利摘要】本发明的商标图像检索方法包括:对样本商标图像进行颜色和局部特征提取;根据灰度频率对样本商标图像分类;进行前景和背景分割;根据前景和背景的像素灰度统计值确定边缘判据;根据边缘判据提取边缘特征;根据边缘特征判断样本商标图像的复杂度以将样本商标图像分为一个以上群组;按照相同提取步骤提取待测商标图像的颜色特征、边缘特征和局部特征;根据边缘特征判断待测商标图像的复杂度以确定其所属群组;综合待测商标图像的颜色和边缘特征在其所属群组中进行相似度检索;在确定待测商标图像与其所属群组中的每一样本商标图像均不相似的情况下在之外的群组中进行相似度检索;在确定重新检索的情况下根据待测商标图像的局部特征进行相似度检索。
【专利说明】商标图像检索方法

【技术领域】
[0001] 本发明涉及图像检索技术,具体地,涉及一种商标图像检索方法。

【背景技术】
[0002] 商标是公司、产品或服务的标志,与企业的商品质量、服务质量、经营管理融为一 体,在工商业社会中起着非常重要的作用,是公司及其产品的一个重要属性,具有唯一性。 为使商标得到合法的保护,必须向商标局正式注册。随着我国经济的发展和全球化进程的 加快,商标数量逐年递增。防止重复注册或相似商标注册是商标管理的核心问题。为了保护 注册商标的合法权益,打击仿冒盗用注册商标的违法行为,需要对待注册的商标进行检索, 与已注册的商标进行比较,确定二者不相同或者不相近似,才具有注册资格。
[0003] 商标图像的识别检索是多媒体信息检索领域的热点问题,图像识别检索方法尽管 多种多样,但其核心问题都是围绕特征提取。目前的商标识别检索方法主要针对背景较简 单的高品质商标图像,对于图像背景较为复杂的商标图像的识别具有一定的局限性,识别 率较低。特别是在图像边缘提取过程中,往往无法保证准确地提取图像边缘。


【发明内容】

[0004] 本发明的目的是针对现有的商标图像识别检索技术在特征提取方面的局限性,提 供一种能够针对不同类型的图像准确提取图像边缘,保证边缘检测效果,提高商标图像识 别准确率的商标图像检索方法。
[0005] 根据本发明的技术方案,提供一种商标图像检索方法,该方法包括以下步骤:获取 样本商标图像;对样本商标图像进行灰度化、归一化和滤波处理后,进行颜色特征提取和局 部特征提取;计算样本商标图像中的灰度频率,并根据计算出的灰度频率对样本商标图像 进行分类;根据分类的结果来确定分割阈值,以对样本商标图像中的前景和背景进行分割; 计算样本商标图像的前景和背景的像素灰度统计值,并根据所述灰度统计值确定边缘判 据;根据确定的边缘判据提取样本商标图像的边缘特征;根据样本商标图像的颜色特征、 边缘特征和局部特征建立商标特征数据库,其中根据样本商标图像的边缘特征判断该样本 商标图像的复杂度,并按照样本商标图像的复杂度将所建立的商标特征数据库中的样本商 标图像分为一个以上的群组;获取待测商标图像;对待测商标图像进行灰度化、归一化和 滤波处理后,按照与样本商标图像相同的提取步骤,提取待测商标图像的颜色特征、边缘特 征和局部特征;根据待测商标图像的边缘特征判断该待测商标图像的复杂度,以确定该待 测商标图像所属的群组;综合待测商标图像的颜色特征和边缘特征,在该待测商标图像所 属的群组中进行相似度检索;在确定待测商标图像与该待测商标图像所属的群组中的每一 样本商标图像均不相似的情况下,根据该待测商标图像的颜色特征和边缘特征,在该待测 商标图像所属的群组之外的群组中进行相似度检索,获得相似度检索结果;根据用户对所 述相似度检索结果的反馈,判断是否进行重新检索;以及在确定进行重新检索的情况下,根 据所述待测商标图像的局部特征,在商标特征数据库中进行相似度检索。
[0006] 根据本发明的技术方案,在样本商标图像的特征提取过程中,能够针对不同类型 的样本图像,按照样本图像的灰度分布而动态地改变分割样本图像为前景和背景的分割阈 值,从而动态地确定边缘判据,进而更准确地提取样本商标图像的边缘特征,同样地,在待 测商标图像的特征提取过程中,也按照与样本商标图像相同的方式进行准确的边缘特征提 取,由此可以更好地保证图像的边缘检测效果,在后续的图像检索过程中能够提高商标图 像识别准确率。
[0007] 此外,现有的商标图像检索针对待测商标图像,均在由样本商标图像建立的商标 特征数据库中进行相似度检索,由于样本商标图像数量巨大,内容繁复,在保证准确率的前 提下往往难以兼顾检索效率。根据本发明的技术方案,在商标特征数据库的建立过程中,根 据样本商标图像的边缘特征判断该样本商标图像的复杂度,并按照样本商标图像的复杂度 将所建立的商标特征数据库中的样本商标图像分为一个以上的群组,由此在后续的相似度 检索中,根据待测商标图像的边缘特征判断该待测商标图像的复杂度以确定该待测商标图 像所属的群组,在该待测商标图像所属的群组中进行相似度检索,而无需在整个商标特征 数据库中进行检索,缩短了检索时间,由此,本发明的商标图像检索方法在保证检索准确率 的同时大大提1? 了图像检索效率。
[0008] 更进一步地,根据本发明的技术方案,在未检索到近似商标图像的情况下,在该待 测商标图像所属的群组之外的群组中进行相似度检索,并且在以待测商标图像的全局特征 进行的检索仍无法获得满意的检测结果的情况下,根据待测商标图像的局部特征,在商标 特征数据库中再次进行相似度检索,由此能够更好地保证相似度检索的准确性。
[0009] 本发明提供的商标图像检索方法能够针对不同类型的图像准确提取图像边缘,保 证边缘检测效果,提高商标图像识别准确率,同时还能够提高图像检索效率,保证相似度检 索的准确性。
[0010] 本发明的其他特征和优点将在随后的【具体实施方式】部分予以详细说明。

【专利附图】

【附图说明】
[0011] 附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具 体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0012] 图1是本发明提供的商标图像检索方法的流程示意图;
[0013] 图2是调整前景不清楚的图像类型I的分割阈值的流程示意图;以及
[0014] 图3是调整背景不清楚的图像类型II的分割阈值的流程示意图。

【具体实施方式】
[0015] 以下结合附图对本发明的【具体实施方式】进行详细说明。应当理解的是,此处所描 述的【具体实施方式】仅用于说明和解释本发明,并不用于限制本发明。
[0016] 本发明提供了一种商标图像检索方法,如图1所示,该方法包括以下步骤:获取样 本商标图像;对样本商标图像进行灰度化、归一化和滤波处理后,进行颜色特征提取和局部 特征提取;计算样本商标图像中的灰度频率,并根据计算出的灰度频率对样本商标图像进 行分类;根据分类的结果来确定分割阈值,以对样本商标图像中的前景和背景进行分割; 计算样本商标图像的前景和背景的像素灰度统计值,并根据所述灰度统计值确定边缘判 据;根据确定的边缘判据提取样本商标图像的边缘特征;根据样本商标图像的颜色特征、 边缘特征和局部特征建立商标特征数据库,其中根据样本商标图像的边缘特征判断该样本 商标图像的复杂度,并按照样本商标图像的复杂度将所建立的商标特征数据库中的样本商 标图像分为一个以上的群组;获取待测商标图像;对待测商标图像进行灰度化、归一化和 滤波处理后,按照与样本商标图像相同的提取步骤,提取待测商标图像的颜色特征、边缘特 征和局部特征;根据待测商标图像的边缘特征判断该待测商标图像的复杂度,以确定该待 测商标图像所属的群组;综合待测商标图像的颜色特征和边缘特征,在该待测商标图像所 属的群组中进行相似度检索;在确定待测商标图像与该待测商标图像所属的群组中的每一 样本商标图像均不相似的情况下,根据该待测商标图像的颜色特征和边缘特征,在该待测 商标图像所属的群组之外的群组中进行相似度检索,获得相似度检索结果;根据用户对所 述相似度检索结果的反馈,判断是否进行重新检索;以及在确定进行重新检索的情况下,根 据所述待测商标图像的局部特征,在商标特征数据库中进行相似度检索。
[0017] 根据本发明的技术方案,为了方便图像特征提取,首先需要对样本商标为图像商 标还是文字图像组合商标进行判断。由此,本发明提供的商标图像检索方法包括以下步骤: 判断样本商标和待测商标是否为文字图像组合商标,并在确定样本商标为文字图像组合商 标时,对样本商标进行文字和图像的分割,以获取样本商标图像。
[0018] 其中,所述文字和图像的分割可以根据实际情况的需要采用基于连通域投影法、 基于连通域面积法、以及基于结构的子图抽取法中的一种来实现,本发明不对其进行限定。
[0019] 基于连通域投影法:对于文字图像组合商标来说,虽然商标中的文字部分可能由 汉字、拼音和英文组成且字体、大小、形状不规则,但是文字通常以行的形式出现,同一行中 的文字个数多于一个且文字的高度相差不大,而商标中的图形部分通常单独位于一行且与 文本行间存在间隔。这是文字图像组合商标中最常见的情况。基于连通域投影的文字消除 方法是将连通域分解所得到的子图像沿水平方向投影,然后按照投影的结果分层为文本层 和图形层,确定图形所在的层且保留该层。
[0020] 基于连通域面积法:图形是商标的关键部分,在大部分文字图像组合商标中,图形 在面积上占主导地位。商标中的文字无论出现在图形的内部或者外部,与图形相比所占的 面积都较小,定义一个面积阈值可以达到去掉噪声面积较小的文字的目的,而对面积较大 的子图形来说,在消除文字噪声前需要做一些判断,防止误消除一些有用的子图形。基于连 通域面积法主要利用图形的外围特征和笔划穿刺特征把文字和图形区分开来,因为文字通 常是由很多笔划组成的不封闭图形,而图形的外轮廓比较平滑,通过该方法可以消除图形 内部的文字,也可以消除和图形的投影相重叠的文字。
[0021] 基于结构的子图抽取法:在部分文字图像组合商标中,与文字部分相比,图形部分 并不占据明显的优势,且图形部分通常和文字部分完全重叠。通常在商标图案的宽高差别 较大时,会出现图形在面积上不占优势的情况,另外,与其它的图像相比,这些图像的结构 比较规则,即具有确定的结构。基于结构的子图抽取法对图像的处理过程如下:对于横向商 标图像,首先计算图像的宽高比并判断是否大于给定的阈值,对宽高比较大的图像(大于 阈值),确定该图像的结构,如果满足事先给定的结构,则保留相应的图像部分。对于纵向商 标图像,可将商标图像逆时针旋转90度,然后按照横向商标图像的方法处理。
[0022] 根据本发明的技术方案,在获取样本商标图像之后,为了方便特征比较,保证图像 尺寸和格式的统一性以及清晰度,对样本商标图像进行特征提取之前,需要对样本商标图 像进行灰度化、归一化和滤波处理。
[0023] 将彩色图像转化成灰度图像的过程称为图像的灰度化处理。彩色图像中每个像素 的颜色由R、G、B三个分量决定,而每个分量有255中值可取,这样一个像素点可以有1600 多万(255*255*255)的颜色的变化范围。而灰度图像是R、G、B三个分量相同的一种特殊的 彩色图像,其一个像素点的变化范围为255种,在数字图像处理中,通常先将各种格式的图 像转变成灰度图像,以使后续图像的计算量变得少一些。灰度图像的描述与彩色图像一样, 仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。图像灰度化处理的常 用方法有分量法、最大值法及加权平均法等,其原理及计算过程为本领域技术人员所公知。
[0024] 图像的归一化是通过一系列变换(即利用图像的不变矩寻找一组参数使其能够 消除其他变换函数对图像变换的影响),将待处理的原始图像转换成相应的唯一标准形式 (该标准形式图像对平移、旋转、缩放等仿射变换具有不变特性)。由于样本商标图像通常 具有不同的格式和尺寸,为了方便特征比较,需要对其中的样本商标图像进行归一化处理。 样本商标图像的格式转换可以采用格式化软件提前进行处理,并通过尺寸归一化将样本商 标图像缩放为同一尺寸。根据本发明的技术方案,可以将样本商标图像的高度和宽度设为 256个像素点。
[0025] 为了保证图像的清晰度,还需要对样本商标图像进行滤波处理。根据本发明的技 术方案,可以采用中值滤波(一种非线性平滑技术,其基本原理是将数字图像或数字序列 中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近真实值,从而消 除孤立的噪声点)对图像进行滤波处理。
[0026] 根据本发明的技术方案,在对样本商标图像进行灰度化、归一化和滤波处理后,首 先对处理后的样本商标图像进行颜色特征提取和局部特征提取。
[0027] 对样本商标图像进行颜色特征提取可以包括:A)对样本商标图像进行颜色特征 量化;以及B)提取颜色直方图。
[0028] 常用的颜色特征量化方法有非间隔量化法和阶层聚类法。本发明采用的方法为对 HSV(H为色调,S为饱和度,V为亮度)颜色空间进行48维非间隔量化,具体步骤如下:
[0029] 将色调H分成8份,饱和度S分成3份,亮度V分成2份;对色调H、饱和度S、亮度 V进行量化:

【权利要求】
1. 一种商标图像检索方法,其特征在于,该方法包括以下步骤: 获取样本商标图像; 对样本商标图像进行灰度化、归一化和滤波处理后,进行颜色特征提取和局部特征提 取; 计算样本商标图像中的灰度频率,并根据计算出的灰度频率对样本商标图像进行分 类; 根据分类的结果来确定分割阈值,以对样本商标图像中的前景和背景进行分割; 计算样本商标图像的前景和背景的像素灰度统计值,并根据所述灰度统计值确定边缘 判据; 根据确定的边缘判据提取样本商标图像的边缘特征; 根据样本商标图像的颜色特征、边缘特征和局部特征建立商标特征数据库,其中根据 样本商标图像的边缘特征判断该样本商标图像的复杂度,并按照样本商标图像的复杂度将 所建立的商标特征数据库中的样本商标图像分为一个以上的群组; 获取待测商标图像; 对待测商标图像进行灰度化、归一化和滤波处理后,按照与样本商标图像相同的提取 步骤,提取待测商标图像的颜色特征、边缘特征和局部特征; 根据待测商标图像的边缘特征判断该待测商标图像的复杂度,以确定该待测商标图像 所属的群组; 综合待测商标图像的颜色特征和边缘特征,在该待测商标图像所属的群组中进行相似 度检索; 在确定待测商标图像与该待测商标图像所属的群组中的每一样本商标图像均不相似 的情况下,根据该待测商标图像的颜色特征和边缘特征,在该待测商标图像所属的群组之 外的群组中进行相似度检索,获得相似度检索结果; 根据用户对所述相似度检索结果的反馈,判断是否进行重新检索;以及 在确定进行重新检索的情况下,根据所述待测商标图像的局部特征,在商标特征数据 库中进行相似度检索。
2. 根据权利要求1所述的方法,其特征在于,该方法还包括以下步骤: 判断样本商标和待测商标是否为文字图像组合商标,并在确定样本商标和/或待测商 标为文字图像组合商标时,对样本商标和/或待测商标进行文字和图像的分割,以获取样 本商标图像和/或待测商标图像。
3. 根据权利要求2所述的方法,其特征在于,所述文字和图像的分割采用基于连通域 投影法、基于连通域面积法、以及基于结构的子图抽取法中的一种来实现。
4. 根据权利要求1所述的方法,其特征在于,所述对样本商标图像进行颜色特征提取 包括:A)对样本商标图像进行颜色特征量化;以及B)提取颜色直方图。
5. 根据权利要求4所述的方法,其特征在于,步骤A)对样本商标图像进行颜色特征量 化包括: 将色调H分成8份,饱和度S分成3份,亮度V分成2份; 对色调H、饱和度S、亮度V进行量化:
9 量化完成后,HSV颜色空间被划分成LHXLSXLV个区间,其中LH、LS、LV分别为H、S、V的量化级数; 把量化后的三个颜色分量合成一维颜色特征向量G: G=H*LH+S·LS+V·LV; 根据量化的数目,LH= 8,LS= 3,LV= 2得出: G= 8H+3S+2V; H,S,V三个分量在一维矢量上分布开来,G的取值范围为[0,1,· 47]。
6. 根据权利要求1所述的方法,其特征在于,所述对样本商标图像进行分类包括:将 样本商标图像分为正常图像类型〇、前景不清楚的图像类型I、以及背景不清楚的图像类型 II。
7. 根据权利要求6所述的方法,其特征在于,所述确定分割阈值包括:确定所述正常图 像类型〇的分割阈值为初始分割阈值,确定所述前景不清楚的图像类型I和背景不清楚的 图像类型II的分割阈值为经过调节的分割阈值。
8. 根据权利要求1所述的方法,其特征在于,所述确定边缘判据包括:根据像素灰度统 计值小于分割阈值的象素的灰度统计均值和像素灰度统计值大于分割阈值的象素的灰度 统计均值之差来确定边缘判据。
9. 根据权利要求8所述的方法,其特征在于,所述前景不清楚的图像类型I和背景不清 楚的图像类型II的分割阈值还根据从初始分割阈值到灰度统计均值的象素数来确定。
10. 根据权利要求1所述的方法,其特征在于,所述局部特征为尺度不变特征转换特征 或加速鲁棒性特征。
11. 根据权利要求1所述的方法,其特征在于,所述综合待测商标图像的颜色特征和边 缘特征在商标特征数据库中进行检索包括:对待测商标图像的颜色特征和形状特征赋予权 重值,按照颜色特征和形状特征的权重值进行检索。
【文档编号】G06F17/30GK104462381SQ201410752382
【公开日】2015年3月25日 申请日期:2014年12月11日 优先权日:2014年12月11日
【发明者】孔军民 申请人:北京中细软移动互联科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1