一种商标图像一致语义提取方法及商标检索方法

文档序号:6625964阅读:370来源:国知局
一种商标图像一致语义提取方法及商标检索方法
【专利摘要】本发明提供了一种商标图像一致语义提取方法及商标检索方法。本发明首先对用于商标图像检索的商标进行相似性的计算,然后在商标的形状表示与匹配的基础上加入相似图像的语义提取方法,最后基于已经计算好的商标图像相似类与语义映射关系提供商标检索的策略。本发明不仅可以在对商标图像分割获取目标对象后进行应用,从而在对象级别进行精确匹配;而且通过该方法,用户还可以用商标图像或文本进行相似商标的检索,其检索结果的查准率和查全率都得到了提高。
【专利说明】一种商标图像一致语义提取方法及商标检索方法

【技术领域】
[0001]本发明涉及图像搜索【技术领域】,尤其是涉及一种商标图像一致语义提取方法及商标检索方法。

【背景技术】
[0002]随着我国市场经济的快速发展,商标图像需求量不断增加,而传统的以基于分类码并且以大量人力为代价的检索方法日益不能解决当前商标注册的矛盾。目前处于研究热点和难点的基于内容商标检索技术,以计算机视觉技术为基础,并利用模式识别等相关计算机辅助知识进行图像检索,为解决当前商标注册问题提供了一个很好的途径。
[0003]传统的常用的图像检索方式与文本信息检索一致,均是通过关键词来进行检索。这种方式一般被称为基于文本的图像检索,其中主要存在两方面问题:第一、该检索方式需要对图像进行合理的关键词标注,然而当前图像自动标注技术尚不成熟;第二、用户有时很难用若干关键词来表示检索条件,而更希望通过以图搜图的方式来查找相似图像。为了解决这些问题,进一步满足用户的检索需求,基于内容的图像检索技术被提出。该技术是直接通过对图像内容进行分析来提取相应的视觉特征,以此实现检索。
[0004]尽管基于内容的图像检索技术已经有了较大的发展,却仍然无法满足人们的检索要求。一方面传统的基于内容的图像检索系统没有考虑图像的语义信息。另一方面,由于特征维数高,运算复杂度高,从提高检索精度或分类正确率的角度而言,都不可能将所有提取的特征都能用于检索或分类。因此,对图像语义特征进行分析和选择成为这一领域最前沿的研究热点之一。
[0005]但如今系统存在从图像的视觉特征到图像的语义表达之间的巨大差距,使得检索无论在准确率和效率上都无法满足用户的需求。其最大的困难就是:系统提取出的图像底层内容特征与用户检索时使用的高层语义之间无法对应起来,也就是说图像特征根本无法表达用户的高层语义,故检索结果往往不令人满意。
[0006]由于商标注册时是根据选择类别进行注册的,因此商标的相似性检索只需要在一个类别里面进行即可。
[0007]中国商标数据库的商标除了商标图像外,还包括商标文字、商标持有人、使用商品、国际分类等信息。
[0008]因而,尽量结合利用商标领域内的知识,缩小从商标图像的视觉特征到商标图像的语义表达之间存在的差距,使检索内容更能符合用户的需求,是一个目前急需解决的问题。


【发明内容】

[0009]本发明的目的在于提供一种商标图像一致语义提取方法及商标检索方法。通过该方法,用户可以用商标图像或文本进行相似商标的检索,其检索结果的查准率和查全率都得到了提高。
[0010]本发明采用如下技术方案:
[0011]一种商标图像一致语义提取方法,其特征在于,包括如下步骤:
[0012]I)商标图像的相似性计算,具体包括:
[0013]1.1)商标对象形状的特征提取;
[0014]1.2)商标图像的特征匹配;
[0015]2)相似图像的语义提取,具体包括:
[0016]2.1)商标图像的相似性矩阵计算;
[0017]2.2)进行商标图像的相似类计算,用于得到若干个商标图像相似类;
[0018]2.3)进行商标图像相似类描述的词频统计及语义映射,得到商标相似类语义映射特征。
[0019]优选的,所述步骤1.1)的特征提取具体如下:
[0020]1.1.1)进行商标对象规范化处理,依次包括目标位置的规范化、目标大小的规范化及目标旋转的规范化;
[0021]1.1.2)计算平面中所有给定样本点的半径最小的外接圆,该最小外接圆作为商标图像的目标区域;
[0022]1.1.3)将目标区域划分成若干等面积的同心圆环;
[0023]1.1.4)将每个同心圆环划分成等面积的若干子块;
[0024]1.1.5)对每个子块进行二值特征计算与提取,统计所有子块的二值特征构成二值特征序列。
[0025]优选的,所述步骤1.1.1)中的位置的规范化是通过将商标图像原点移至图像重心来实现;所述的目标大小的规范化是将目标位置规范化后的商标图像缩放到一致的大小;所述的目标旋转的规范化是对目标大小规范化后的商标图像,计算其目标形状主轴方向与水平方向的夹角后进行旋转实现。
[0026]优选的,1.1.5)中对每个子块进行二值特征计算与提取,统计所有子块的二值特征构成二值特征序列,是指对每个子块统计目标像素占该子块像素的比重,来确定每个子块的统计值,所有子块的统计值构成二值特征序列。
[0027]优选的,步骤1.2)所述的商标图像的特征的匹配,具体如下:
[0028]设定两个商标图像的二值特征序列分别为SB1和SB2,长度皆为KXM,且要求两个


二值特征序列的有效长度偏差不超过50%,

【权利要求】
1.一种商标图像一致语义提取方法,其特征在于,包括如下步骤: 1)商标图像的相似性计算,具体包括: 1.1)商标对象形状的特征提取; 1.2)商标图像的特征匹配; 2)相似图像的语义提取,具体包括: 2.1)商标图像的相似性矩阵计算; 2.2)进行商标图像的相似类计算,用于得到若干个商标图像相似类; 2.3)进行商标图像相似类描述的词频统计及语义映射,得到商标相似类语义映射特征。
2.如权利要求1所述的一种商标图像一致语义提取方法,其特征在于,所述步骤1.1)的特征提取具体如下: 1.1.1)进行商标对象规范化处理,依次包括目标位置的规范化、目标大小的规范化及目标旋转的规范化; 1.1.2)计算平面中所有给定样本点的半径最小的外接圆,该最小外接圆作为商标图像的目标区域; 1.1.3)将目标区域划分成若干等面积的同心圆环; 1.1.4)将每个同心圆环划分成等面积的若干子块; 1.1.5)对每个子块进行二值特征计算与提取,统计所有子块的二值特征构成二值特征序列。
3.如权利要求2所述的一种商标图像一致语义提取方法,其特征在于,所述步骤1.1.D中的位置的规范化是通过将商标图像原点移至图像重心来实现;所述的目标大小的规范化是将目标位置规范化后的商标图像缩放到一致的大小;所述的目标旋转的规范化是对目标大小规范化后的商标图像,计算其目标形状主轴方向与水平方向的夹角后进行旋转实现。
4.如权利要求2所述的一种商标图像一致语义提取方法,其特征在于,1.1.5)中对每个子块进行二值特征计算与提取,统计所有子块的二值特征构成二值特征序列,是指对每个子块统计目标像素占该子块像素的比重,来确定每个子块的统计值,所有子块的统计值构成二值特征序列。
5.如权利要求1所述的一种商标图像一致语义提取方法,其特征在于,步骤1.2)所述的商标图像的特征的匹配,具体如下: 设定两个商标图像的二值特征序列分别为SB1和SB2,长度皆为KXM,且要求两个二值

特征序列的有效长度偏差不超过50%,
.相似性度量计算公式如下:
其中,“n”为按位与操作符,“u”操作符用于将特征向量序列按位相加,“U (SB1 n SB2) ”表示两个二值特征序列间非零相似位的个数,而“U (SB1)+ U (SB2) ”表示两个商标图像的二值特征序列的所有位之和。
6.如权利要求1所述的一种商标图像一致语义提取方法,其特征在于,步骤2.1)所述的商标图像的相似性矩阵计算,具体是指:设某个商标分类里面有η个商标图像,分别为a1; a2,..., an,商标图像Si与a」的相似度用Sy表示,i, j e [I, η],基于步骤1.2)对所有商标图像两两进行相似度计算,可以得到如下相似性矩阵
该矩阵为对称矩阵,Sijj e [O,I],并且当i=j时,Si,j=l。
7.如权利要求1所述的一种商标图像一致语义提取方法,其特征在于,步骤2.2)所述的商标图像的相似类计算,预先设定一个阈值,基于步骤2.1)得到的相似性矩阵计算商标图像的相似类,包括如下步骤: 2.2.1)对相似性矩阵左下部分或右上部分的相似度值按从大到小排序,并记录相似度值对应的相似性矩阵的位置; 2.2.2)每个商标图像开始都单独视为一类; 2.2.3)依次判断按相似度大小排序构成的序列的每个相似度值,如果大于阈值,则将其对应的相似性矩阵上的所在行和列取出并为一类,同时划掉该行和列,即可得到若干个商标图像相似类。
8.如权利要求1所述的一种商标图像一致语义提取方法,其特征在于,步骤2.3)中的相似商标类描述的词频统计及语义映射,基于商标图像注册时的商标文字描述,包括如下步骤: 2.3.1)对商标文字描述进行中文分词,分词后去除停用词,得到若干关键词,基于步骤2.2)得到的每个商标图像相似类将对应一序列关键词,或者一个关键词对应多个商标图像相似类; 2.3.2)在每个商标图像相似类对应的关键词中取出现频率最大的若干个关键词,构成商标相似类语义映射特征。
9.一种商标检索方法,其特征在于,基于权利要求1至8所述的任种商标图像一致语义提取方法实现,用户上传商标图像后,与步骤2.2)得到的若干个商标图像相似类进行比较,输出最相似的商标图像类,作为第一部分输出;而后根据对应的商标图像相似类语义映射特征,得到多个关键词,通过这些关键词进行检索,输出结果作为第二部分输出。
10.一种商标检索方法,其特征在于,基于权利要求1至8所述的任种商标图像一致语义提取方法实现,用户输入关键词后,首先,通过输入的关键词进行检索,检索结果作为第一部分输出;而后根据对应的商标图像相似类语义映射特征得到商标图像相似类,作为第二部分输出。
【文档编号】G06K9/46GK104199931SQ201410448991
【公开日】2014年12月10日 申请日期:2014年9月4日 优先权日:2014年9月4日
【发明者】洪志令, 吴梅红 申请人:厦门大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1