基于切比雪夫傅里叶矩的复杂Logo图案特征提取方法

文档序号:9350385阅读:523来源:国知局
基于切比雪夫傅里叶矩的复杂Logo图案特征提取方法
【技术领域】
[0001] 本发明属于图像处理领域,具体涉及一种基于切比雪夫傅里叶矩的复杂Logo图 案特征提取方法,对图像不同大小、旋转角度、位置进行识别。
【背景技术】
[0002] 作为商家产品的一个重要形象标识,Logo图案是最具有代表性的文化象征,在生 活中运用十分广泛,无论在服饰、家电、建筑、食品等方面,还是广告、偶像剧、杂志等媒体 上,都能处处可见其身影。Logo本身不仅能够区别于其它企业、产品或者服务,使受众对企 业留下深刻印象,而且标志着企业的经营理念、文化特色、价值取向,反映企业的产业特点 和经营思路。
[0003] 在自然场景中,Logo本身设计的越来越具有艺术色彩,颜色上更加丰富,结构上越 来越多样化,传统上的几何方法已经不能显著提高其识别率。在一张自然图片上,Logo的 位置往往具有不确定性、图像的大小不一、扭曲拉伸的角度不同、不同光照条件下的明暗程 度不一等等这些因素,让Logo的识别越来越具有挑战性。
[0004] 在提取复杂Logo图案特征这方面,有基于内容核的、PCA-SIFT、几何核等方法来 做的。本文采用图像矩的思想,将图像的特征信息用函数的变化来表达。切比雪夫傅里叶 矩最早是由Ping等提出的概念,与此同时类似的想法还有Zernike矩、Fourier-Mellin矩、 Jacobi-Fourier矩等。通过提取复杂logo图案特征进行分析,可以研究在视频节目等应用 场景下针对用户进行广告产品推送。

【发明内容】

[0005] 为了克服上述【背景技术】的缺陷,本发明提供一种基于切比雪夫傅里叶矩的复杂 Logo图案特征提取方法,能够对图像大小、旋转角度、位置进行识别。
[0006] 为了解决上述技术问题本发明的所采用的技术方案为:
[0007] -种基于切比雪夫傅里叶矩的复杂Logo图案特征提取方法,提取复杂Logo图案 外轮廓,寻找所述复杂Logo图案的外轮廓的最小外接覆盖圆,使用双线性插值方法依次对 所述最小外接覆盖圆内的各个像素进行拉伸或缩小变换,用切比雪夫傅里叶矩提取变换后 的复杂Logo图案特征。
[0008] 较佳地,所述提取复杂Logo图案外轮廓的方法为:首先将复杂Logo图案转化为灰 度图像,然后采用边缘检测算子提取外轮廓各点的坐标值。
[0009] 较佳地,采用canny边缘检测算子提取外轮廓各点坐标值,提取图像内相邻像素 灰度差发生变化的点,若灰度差值大于阈值〇. 5,则提取该点为外轮廓坐标点之一,若灰度 差值小于阈值〇. 5,则不对该点进行处理。
[0010] 较佳地,所述最小外接覆盖圆的提取方法为:步骤一,复杂Logo图案外轮廓上距 离最远的两个坐标点,记为A、B,将所述A、B之间的连线作为长轴;步骤二,计算外轮廓上每 个坐标点到所述长轴的垂直距离,其中到所述长轴垂直距离最大的坐标点为C,以所述A、 B、C三个点为顶点作三角形;步骤三,作出三角形的外接圆,记圆心为0,半径为R;步骤四, 算复杂Logo图案外轮廓上每个坐标点到圆心0的距离,记为Pi,i=l~a,其中a为外轮 廓上坐标点的个数,依次比较PjPR的大小,若PAR,则分别计算所述三角形三个顶点A、B、 C到P1的距离,取到所述P 离最小的顶点,用Pi的坐标替代该顶点的坐标,构成一个新的 三角形,并返回步骤三;若P'R,则得出该圆为最小外接覆盖圆。
[0011] 较佳地,使用双线性插值方法对所述最小外接覆盖圆内的各个像素进行拉伸或缩 小变换的方法为:首先对待变换点在X方向上进行线性插值,得到
[0018] 其中,Qn、Q12、Q2i和Qm是待变换点相邻的四个点,(X1,yi)是Qii的坐标,(X1,yJ是 Q12的坐标,(X2,yi)是Q21的坐标,(X2,y2)是Q22的坐标,RJPR2分别代表QnQ2JPQ12Q22方 向上的插值点,f(point)表示该像素点的灰度值,其中point为Qn、Q12、Q21、Q22、RpR2、P。
[0019] 较佳地,用切比雪夫傅里叶矩提取复杂Logo图案特征,所述复杂Logo图案特征矩 阵值
示傅里叶里圆周谐波阶数,r表示二维坐标系下每个像素点的半径,0表示二维坐标系下 每个像素点与X正方向的夹角,Itfvm.表示在(n+m)阶下的切比雪夫傅里叶矩值,f(r,0) 表示对应r和0下图像的灰度值,Rn(r)表示切比雪夫多项式函数,j是复数的虚数单位,exp(_jm0)表示傅里叶变换里的复指数函数,dr表示r方向上的一阶导数,d0表示0方 向上的一阶导数,k是自然数,k= 0,l,…,(n+2)/2。
[0024] 较佳地,在提取所述复杂Logo图案特征之后还包括对所述复杂Logo图案特征进 行识别和输出的步骤:依据欧式距离D判断复杂Logo图案特征的相似性,提取待识别复杂 Logo图案特征与数据库中各图像特征进行比较,判断所述复杂Logo图案所应归属的类别, 输出相似的Logo图案。
[0025] 较佳地,复杂Logo图案特征是指复杂Logo图案特征矩阵值,所述数据库中各图像 特征是指数据库中各图像特征矩阵值。
[0026] 较佳地,所述欧式距离D为:
矩矩阵,nmax和m_分别代表(n+m)阶矩对应最大的n和m值。
[0029] 本发明的有益效果在于:提出了一种全新的方法用来对复杂Logo图案进行特征 提取。通过寻找复杂Logo图案的外轮廓的最小外接覆盖圆,能够消除复杂Logo图案的位置 不确定性带来的识别率低问题;通过双线性插值方法对圆内图像进行伸缩变换,能够消除 复杂Logo图案的大小变换带来的识别率低问题;通过切比雪夫傅里叶矩方法提取变换后 复杂Logo图案特征,能够消除复杂Logo图案的旋转变换带来的识别率低问题,通过上述方 法的结合从技术角度上能够有效提高复杂Logo图案在自然场景中自动识别的准确率。为 用户在观看视频节目时提供个性化的智能推送服务,为商家宣传自家产品进行智能化营销 提供了可行方便且新颖的技术方案。
【附图说明】
[0030] 图1为不同复杂程度的Logo图案;
[0031] 图2为不同大小和旋转角度的Logo图案;
[0032] 图3为本发明实施例复杂Logo最小外接覆盖圆图;
[0033] 图4为本发明实施例双线性插值差值法变换示意图;
[0034] 图5为切比雪夫傅里叶矩多项式函数图;
[0035] 图6为本发明实施例单位圆内图像转到极坐标系下的示意图;
[0036] 图7为本发明实施例复杂Logo图案在不同切比雪夫多项式阶数和傅里叶里圆周 谐波阶数下的识别率图;
[0037] 图8为本发明实施例识别率为96%的类内聚类图;
[0038] 图9为本发明实施例识别率为96%的类间聚类图;
[0039] 图10为本发明实施例的流程图。
【具体实施方式】
[0040] 下面结合附图和实施例对本发明做进一步的说明。
[0041] 一种基于切比雪夫傅里叶矩的复杂Logo图案特征提取方法:
[0042]步骤1,提取复杂Logo图案外轮廓。
[0043] 首先,将复杂Logo图案转化为灰度图像,然后采用边缘检测算子提取外轮廓各点 的坐标值。
[0044] 本实施例采用canny边缘检测算子提取外轮廓各点坐标值,提取图像内相邻像素 灰度差发生变化的点,若灰度差值大于阈值〇. 5,则提取该点为外轮廓坐标点之一,若灰度 差值小于阈值〇. 5,则不对该点进行处理。图1显示的是不同复杂程度的Logo图案,图2显 示的是不同场景下Logo图案的特点。
[0045] 步骤2,寻找复杂Logo图案的外轮廓的最小外接覆盖圆,最小外接覆盖圆是以图 像内部点为圆心,画一个圆,此图案所有像素点位于一个圆内,且该圆是最小的,即可保证 图案在自然场景中平移的不变性。提取方法如下:
[0046] 步骤2. 1,取复杂Logo图案外轮廓上距离最远的两个坐标点,记为A、B,将A、B之 间的连线作为长轴;
[0047] 步骤2. 2,计算外轮廓上每个坐标点到长轴的垂直距离,其中到长轴垂直距离最大 的坐标点为C,以A、B、C三个点为顶点作三角形;
[0048] 步骤2. 3,作出三角形的外接圆,记圆心为0,半径为R;
[0049] 步骤2. 4,计算复杂Logo图案外轮廓上每个坐标点到圆心0的距离,记为P1, i= 1~a,其中a为外轮廓上坐标点的个数,依次比较PjPR的大小,
[0050]若PAR,则分别计算三角形三个顶点A、B、C到P1的距离,取到Pi距离最小的顶点, 用P1的坐标替代该顶点的坐标,构成一个新的三角形,并返回步骤2. 3 ;
[0051] 若P'R,则得出该圆为最小外接覆盖圆。
[0052] 图3显示的是图案的最小外接覆盖圆。
[0053] 步骤3,使用双线性插值方法依次对最小外接覆盖圆内的各个像素进行拉伸或缩 小变换,获取四个最近邻目标像素的像素值乘以权重系数,来对图像进行放大缩小,即可保 证图案在自然场景中伸缩的不变性。变换的方法为:
[0054] 首先对待变换点在X方向上进行线性插值,得到
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1