商标检索方法

文档序号:6638006阅读:406来源:国知局
商标检索方法
【专利摘要】本发明提供的商标检索方法包括以下步骤:对样本商标进行文字和图像的分割以分割成文字和图像部分;对样本商标的整体、该样本商标的图像部分以及该样本商标的文字部分分别进行特征提取;根据提取的特征,针对样本商标的整体、样本商标的图像部分以及样本商标的文字部分分别建立整体特征数据库、图像特征数据库以及文字特征数据库;按照与样本商标相同的步骤,对待测商标进行文字和图像的分割以及特征提取;根据待测商标的图像部分和文字部分的特征,分别在图像特征数据库和文字特征数据库中进行相似度检索;在待测商标的图像部分和文字部分的相似度均不满足相似度阈值的情况下,根据待测商标整体的特征,在整体特征数据库中进行相似度检索。
【专利说明】商标检索方法

【技术领域】
[0001] 本发明涉及多媒体信息检索技术,具体地,涉及一种商标检索方法。

【背景技术】
[0002] 商标是公司、产品或服务的标志,与企业的商品质量、服务质量、经营管理融为一 体,在工商业社会中起着非常重要的作用,是公司及其产品的一个重要属性,具有唯一性。 为使商标得到合法的保护,必须向商标局正式注册。随着我国经济的发展和全球化进程的 加快,商标数量逐年递增。防止重复注册或相似商标注册是商标管理的核心问题。为了保护 注册商标的合法权益,打击仿冒盗用注册商标的违法行为,需要对待注册的商标进行检索, 与已注册的商标进行比较,确定二者不相同或者不相近似,才具有注册资格。
[0003] 商标的识别检索是多媒体信息检索领域的热点问题,人们研宄和实现了多种不同 的形状匹配算法,但对于多组合商标、尤其是文字和图形组合商标来说,并没有对商标中重 要的文字信息和图像信息进行专门识别的方法,导致对于多组合商标的识别结果误差较 大。


【发明内容】

[0004] 本发明的目的是针对现有的商标识别检索技术对于多组合商标的识别率较低的 问题,提供一种针对多组合商标的快速有效、识别率高的商标检索方法。
[0005] 根据本发明的技术方案,提供一种商标检索方法,该方法包括以下步骤:获取所有 样本商标;对样本商标进行文字和图像的分割,以分割成文字部分和图像部分;对样本商 标的整体、该样本商标的图像部分、以及该样本商标的文字部分分别进行特征提取;根据提 取的特征,针对样本商标的整体、样本商标的图像部分、以及样本商标的文字部分分别建 立整体特征数据库、图像特征数据库、以及文字特征数据库;获取待测商标;按照与样本商 标相同的步骤,对待测商标进行文字和图像的分割以及特征提取;根据待测商标的图像部 分和文字部分的特征,分别在图像特征数据库和文字特征数据库中进行相似度检索,获得 相似度检索结果;在待测商标的图像部分和文字部分的相似度均不满足相似度阈值的情况 下,根据待测商标整体的特征,在整体特征数据库中进行相似度检索。
[0006] 根据本发明的技术方案,将样本商标分割成文字部分和图像部分,并对分割前和 分割后的样本商标分别进行特征提取,对于待测商标同样进行文字和图像分割以及特征提 取,并分别针对待测商标的文字部分和图像部分进行相似度检索。更进一步地,如果针对待 测商标的文字部分和图像部分均没有检索到相同或近似结果,再以商标整体进行相似度检 索。
[0007] 本发明的商标检索方法对多组合商标的整体内容进行了分类处理,图形特征和文 字特征的提取更加详尽,对多组合商标的文字部分和图像部分均进行了专门的识别和检 索,快速有效且识别率更高,克服了现有技术存在的对多组合商标的识别结果误差较大的 问题,在未获得满意的识别结果的情况下,本发明的商标检索方法还按照文字和图形结合 的商标整体进行了相似度检索,能够更好地保证相似度检索的准确性。
[0008] 本发明的其他特征和优点将在随后的【具体实施方式】部分予以详细说明。

【专利附图】

【附图说明】
[0009] 附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具 体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0010] 图1是本发明提供的商标检索方法的流程示意图。

【具体实施方式】
[0011] 以下结合附图对本发明的【具体实施方式】进行详细说明。应当理解的是,此处所描 述的【具体实施方式】仅用于说明和解释本发明,并不用于限制本发明。
[0012] 本发明提供了一种商标检索方法,如图1所示,该方法包括以下步骤:获取所有样 本商标;对样本商标进行文字和图像的分割,以分割成文字部分和图像部分;对样本商标 的整体、该样本商标的图像部分、以及该样本商标的文字部分分别进行特征提取;根据提取 的特征,针对样本商标的整体、样本商标的图像部分、以及样本商标的文字部分分别建立整 体特征数据库、图像特征数据库、以及文字特征数据库;获取待测商标;按照与样本商标相 同的步骤,对待测商标进行文字和图像的分割以及特征提取;根据待测商标的图像部分和 文字部分的特征,分别在图像特征数据库和文字特征数据库中进行相似度检索,获得相似 度检索结果;在待测商标的图像部分和文字部分的相似度均不满足相似度阈值的情况下, 根据待测商标整体的特征,在整体特征数据库中进行相似度检索。
[0013] 根据本发明的技术方案,此处"所有的样本商标"指的是已注册的、并定期更新或 实时更新的所有商标。对多组合样本商标进行的文字和图像的分割可以根据实际情况的需 要采用基于连通域投影法、基于连通域面积法、以及基于结构的子图抽取法中的一者来实 现,本发明不对其进行限定。
[0014] 基于连通域投影法:对于文字图像组合商标来说,虽然商标中的文字部分可能由 汉字、拼音和英文组成且字体、大小、形状不规则,但是文字通常以行的形式出现,同一行中 的文字个数多于一个且文字的高度相差不大,而商标中的图形部分通常单独位于一行且与 文本行间存在间隔。这是文字图像组合商标中最常见的情况。基于连通域投影的文字消除 方法是将连通域分解所得到的子图像沿水平方向投影,然后按照投影的结果分层为文本层 和图形层,确定图形所在的层且保留该层。
[0015] 基于连通域面积法:图形是商标的关键部分,在大部分文字图像组合商标中,图形 在面积上占主导地位。商标中的文字无论出现在图形的内部或者外部,与图形相比所占的 面积都较小,定义一个面积阈值可以达到去掉噪声面积较小的文字的目的,而对面积较大 的子图形来说,在消除文字噪声前需要做一些判断,防止误消除一些有用的子图形。基于连 通域面积法主要利用图形的外围特征和笔划穿刺特征把文字和图形区分开来,因为文字通 常是由很多笔划组成的不封闭图形,而图形的外轮廓比较平滑,通过该方法可以消除图形 内部的文字,也可以消除和图形的投影相重叠的文字。
[0016] 基于结构的子图抽取法:在部分文字图像组合商标中,与文字部分相比,图形部分 并不占据明显的优势,且图形部分通常和文字部分完全重叠。通常在商标图案的宽高差别 较大时,会出现图形在面积上不占优势的情况,另外,与其它的图像相比,这些图像的结构 比较规则,即具有确定的结构。基于结构的子图抽取法对图像的处理过程如下:对于横向商 标图像,首先计算图像的宽高比并判断是否大于给定的阈值,对宽高比较大的图像(大于 阈值),确定该图像的结构,如果满足事先给定的结构,则保留相应的图像部分。对于纵向商 标图像,可将商标图像逆时针旋转90度,然后按照横向商标图像的方法处理。
[0017] 根据本发明的技术方案,在完成样本商标的文字和图像分割之后,对样本商标的 整体、该样本商标的图像部分、以及该样本商标的文字部分分别进行特征提取。
[0018] 对于样本商标的整体的特征提取,根据实际情况的需要,对样本商标的整体的特 征提取可以包括全局特征提取或局部特征提取,或包括全局特征和局部特征提取两者,本 发明不对此进行限定。
[0019] 其中,所述全局特征可以包括颜色特征和边缘形状特征。颜色特征用于描述图像 或图像区域所对应的景物的表面性质。常用的颜色特征提取方法包括颜色直方图、颜色集、 颜色矩、颜色聚合向量、颜色相关图等等,其原理及计算过程为本领域技术人员所公知。
[0020] 所谓边缘,是指其周围像素灰度急剧变化的那些象素的集合,边缘存在于目标、背 景和区域之间,是图像最基本的特征。所述边缘形状特征信息的提取可采用以下边缘检测 算法中的任一者实现:Sobel算子边缘检测、Roberts算子边缘检测、Prewitt算子边缘检 测、Laplacian算子边缘检测、以及Canny算子边缘检测。
[0021] USobel算子边缘检测
[0022] Sobel算子主要用于边缘检测,在技术上是以离散型的差分算子,用以运算图像亮 度函数的梯度的近似值,Sobel算子是典型的基于一阶导数的边缘检测算子,由于该算子中 引入了类似局部平均的运算,因此对噪声具有平滑作用,能很好的消除噪声的影响。
[0023] Sobel算子包含两组3x3的矩阵,分别为横向及纵向模板,将之与图像作平面卷 积,即可分别得出横向及纵向的亮度差分近似值。实际使用中,常用以下两个模板来检测图 像边缘。
[0024] 检测水平边沿横向模板:

【权利要求】
1. 一种商标检索方法,其特征在于,该方法包括w下步骤: 获取所有样本商标; 对样本商标进行文字和图像的分割,W分割成文字部分和图像部分; 对样本商标的整体、该样本商标的图像部分、W及该样本商标的文字部分分别进行特 征提取; 根据提取的特征,针对样本商标的整体、样本商标的图像部分、W及样本商标的文字部 分分别建立整体特征数据库、图像特征数据库、W及文字特征数据库; 获取待测商标; 按照与样本商标相同的步骤,对待测商标进行文字和图像的分割W及特征提取; 根据待测商标的图像部分和文字部分的特征,分别在图像特征数据库和文字特征数据 库中进行相似度检索,获得相似度检索结果; 在待测商标的图像部分和文字部分的相似度均不满足相似度阔值的情况下,根据待测 商标整体的特征,在整体特征数据库中进行相似度检索。
2. 根据权利要求1所述的方法,其特征在于,所述文字和图像的分割采用基于连通域 投影法、基于连通域面积法、W及基于结构的子图抽取法中的一种来实现。
3. 根据权利要求1所述的方法,其特征在于,对样本商标的整体和待测商标整体的特 征提取包括全局特征提取和/或局部特征提取。
4. 根据权利要求3所述的方法,其特征在于,所述全局特征包括颜色特征和边缘形状 特征。
5. 根据权利要求3所述的方法,其特征在于,所述局部特征包括尺度不变特征转换特 征或加速鲁椿性特征。
6. 根据权利要求1所述的方法,其特征在于,对样本商标和待测商标的图像部分的特 征提取包括全局特征提取和/或局部特征提取。
7. 根据权利要求6所述的方法,其特征在于,所述全局特征包括颜色特征和边缘形状 特征。
8. 根据权利要求6所述的方法,其特征在于,所述局部特征包括尺度不变特征转换特 征或加速鲁椿性特征。
9. 根据权利要求1所述的方法,其特征在于,对样本商标和待测商标的文字部分的特 征提取包括结构特征提取或像素分布特征提取。
10. 根据权利要求9所述的方法,其特征在于,所述像素分布特征提取为逐像素特征提 取、骨架特征提取或微结构特征提取。
【文档编号】G06F17/30GK104462380SQ201410752381
【公开日】2015年3月25日 申请日期:2014年12月11日 优先权日:2014年12月11日
【发明者】孔军民 申请人:北京中细软移动互联科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1