基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置与流程

文档序号:18705766发布日期:2019-09-17 23:40阅读:189来源:国知局
基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置与流程

本发明涉及图像匹配领域,特别涉及一种基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置。



背景技术:

天珠具有独具特色的图腾图案,渊源流传,是文化的载体。天珠的材质一般为玉石,并且以硬玉多见,形状一般为圆柱体或两端比中间略细的类圆柱体,以及球体或椭球体。天珠一般都具有特殊的纹理。典型的天珠如图1、2、3所示,其中,图1是短圆柱状的天珠,图2是椭球状的天珠,图3是长圆柱状的天珠。天珠的材质可以取自天然材料,也可以人工合成。识别天珠身份对于历史研究以及规范收藏市场均具有重要意义,而天珠图案对于天珠身份识别至关重要。

传统天珠身份辨识基于专家学者在放大镜辅助下肉眼进行判断,凭借自身经验和主观感觉,其结果受到内在学识和外界环境影响较大,这使得传统天珠身份辨识结果不可避免地带有一定的个人主观性,而且人工操作效率较低,也不宜在非专业的天珠收藏和爱好人群中推广。由于专家和学者判断依据和经验阅历不同,鉴定结果也是千差万别,无法进行天珠身份辨识标准化,阻碍天珠收藏市场的发展。另外,天珠专家学者人数毕竟有限,而近年来天珠市场的需求又增长迅速,所以急需一种可替代专家学者的天珠身份辨识方法,能够自动、高效、客观、准确地识别天珠,给天珠爱好者和收藏着提供一个简便、准确和智能的天珠身份辨识方法。

计算机在图像匹配领域的发展为天珠自动身份辨识提供了研究的基础。然而,天珠图案具有宏观文化图腾表示,同时又具有微观磕碰划痕的自然痕迹,如何克服微观磕碰划痕在天珠识别过程中带来的干扰,是天珠身份辨识中不得不考虑的难题;天珠作为一种非朗伯体(朗伯体是一个完全的漫反射体,即入射能量以入射点为中心,能够在整个半球空间内向四周各向同性地反射能量实现漫反射的物体),在强光照下会出现镜面反射的高光区域,并且所述高光区域会部分或全部地掩盖原有物体图像的曲面立体特性,进一步增加了天珠身份辨识的难度。基于手机等便携拍照设备的普及,为开发基于图像匹配技术的天珠身份辨识技术提供了可能性。但是,不同类型的手机即不同类型的图像采集设备的分辨率存在很大的差异,成像细节也呈现出巨大的差异,从而对完成图像匹配造成极大的困难;又由于天珠大多数并不是规则的圆柱体或球体,而是具有特殊曲面的不规则体,从不同拍摄视角得到的不同图像差别极大,而实际匹配中又需要匹配任意视角下拍摄的天珠图像,进一步增加了图像匹配的难度。



技术实现要素:

本发明针对上述技术问题,提出了一种基于图像金字塔梯度直方图的天珠身份辨识方法及装置。基于具有网络功能的便携图像采集设备,诸如手机、手提电脑、平板电脑等,提供相应辅助信息,具有使用友好性、便捷性。提取天珠图像的金字塔梯度直方图特征用于数据库比对,克服了不同光照环境下、不同分辨率和任意角度拍摄的天珠辨识挑战,具有普适性和鲁棒性。

为解决上述技术问题,根据本发明的一个方面,提供了一种基于图像金字塔梯度直方图特征的天珠身份辨识方法,所述方法包括以下步骤:

1)天珠图像模板生成,包括:

1.1)从多个不同角度采集天珠图像;

1.2)提取天珠图像的金字塔梯度直方图特征,得到特征模板文件;

1.3)将特征模板文件存储到数据库;

2)基于天珠图像模板进行天珠身份认证,包括

2.1)采集实际天珠图像;

2.2)将所述实际天珠图像送到服务器;

2.3)计算所述提取天珠图像的金字塔梯度直方图特征与数据库中存储的特征模板文件中的天珠特征的距离,根据设定阈值辨识天珠身份。

优选地,所述从多个不同角度采集天珠图像包括:视频采集设备采集天珠视频,采集完成后,将视频进行抽帧操作,满足天珠转一圈等间隔选取120帧,覆盖天珠全部视角图像。

优选地,所述金字塔梯度直方图特征为天珠图像矩形区域的金字塔梯度直方图特征。

优选地,所述提取天珠图像的金字塔梯度直方图特征包括;

1.2.1)对矩形区域进行归一化预处理:灰度归一化由灰度直方图均衡化得到,计算如式(1)和式(2)所示,

其中,k表示归一化预处理前矩形区域图像的灰度值,nk表示灰度级为rk的像素点个数,m和n表示图像高度和宽度,pr(rk)表示出现的概率,l表示均衡后灰度级数,sk表示直方图均衡后对应的值;

大小归一化由双线性插值得到,计算如式(3)所示,

其中,x1、y1、x2、y2为坐标值,q11=(x1,y1)表示q11点坐标,同理q12=(x1,y2),q21=(x2,y1)和q22=(x2,y2)分别表示q12、q21和q22点坐标。f(q11)表示q11点像素灰度值,f(q12)表示q12点像素灰度值,f(q21)表示q21点像素灰度值,f(q22)表示q22点像素灰度值,计算得到点p=(x,y)的灰度值f(x,y)。

优选地,所述提取天珠图像的金字塔梯度直方图特征包括;

1.2.2)基于最大类间方差法即otsu算法迭代求解使两类类间方差最大化的阈值,计算如式(4)所示,

其中,t为迭代求解阈值,ω0(t)和ω1(t)分别表示类别概率,表示类内方差;

最后迭代求解阈值t加上先验阈值t0得到二值化阈值t,如式(5)所示,

t=t+t0(5)。

优选地,所述提取天珠图像的金字塔梯度直方图特征包括;

1.2.3)基于天珠纹理图像中求得每个像素点的梯度值和梯度方向,并将梯度方向量化为9个方向得到梯度直方图(histogramsoforientationgradients,hog)特征,计算如式(6)-式(9)所示,

其中,i表示灰度图像,表示卷积,gx、gy和g表示梯度值,α表示梯度方向。

优选地,所述提取天珠图像的金字塔梯度直方图特征包括;

1.2.4)将天珠纹理图像区域依据高宽比1∶1进行划分,共得到4个子区域,分别对4个子区域提取梯度直方图特征。

优选地,所述提取天珠图像的金字塔梯度直方图特征包括;

1.2.5)将上述每个子区域依据高宽比1∶1再进行划分,共得到16个子区域,分别对16个子区域提取梯度直方图特征。

优选地,所述提取天珠图像的金字塔梯度直方图特征包括;

1.2.6)将上述直方图顺序连接得到金字塔梯度直方图(pyramidofhistogramsoforientationgradients,phog)特征,其特征维数为(1+4+16)*9=189维特征向量,进行归一化,存储为特征模板文件。

优选地,所述基于天珠图像模板进行天珠身份认证包括:

2.1)所述采集实际天珠图像包括:采用具有网络功能的便携图像采集设备拍摄天珠图像,根据选择辨识天珠信息采用与真实天珠比例的图像框辅助获取图像。

优选地,所述基于天珠图像模板进行天珠身份认证包括:

2.2)将图像框内天珠图像送到服务器后台,提取天珠图像矩形区域的金字塔梯度直方图特征。

优选地,所述基于天珠图像模板进行天珠身份认证包括:

2.3)所述计算所述提取天珠图像的金字塔梯度直方图特征与数据库中存储的特征模板文件中的天珠特征的距离为chamfer距离,计算如式(10)所示,

其中,xt和xm分别表示数据库天珠和用户上传待测天珠的金字塔梯度直方图即phog特征,m表示特征维度,nm表示归一化常数;

所述根据设定阈值进行辨识身份,如式(11)所示:

其中,t1表示预先设定辨识阈值,id=1表示当前用户上传待测天珠与数据库录入天珠身份一致,同理,id=0表示当前用户上传待测天珠与数据库录入天珠身份不一致。

优选地,其中步骤2.2)中还包括如下步骤:

2.2.1)先进行天珠图像的整体识别,利用采集到的整张天珠图像分析整体图案的梯度分布,与天珠模板库中的天珠图案的梯度分布进行匹配,得到相似值,对于相似值大于阈值的整张天珠图像,进入步骤2.2;

2.2.2)将整张天珠图像进行网络划分,其中,将天珠纹理图像区域依据高宽比1∶1进行划分,共得到4个子区域,分别对4个子区域提取梯度直方图特征;

2.2.3)将上述每个子区域依据高宽比1∶1再进行划分,共得到16个子区域,分别对16个子区域提取梯度直方图特征;

2.2.4)将上述直方图顺序连接得到金字塔梯度直方图(pyramidofhistogramsoforientationgradients,phog)特征,其特征维数为(1+4+16)*9=189维特征向量,进行归一化,得到天珠图像矩形区域的金字塔梯度直方图特征。

根据本发明的另一个方面,提供了一种基于图像金字塔梯度直方图特征的天珠身份辨识装置,所述装置包括:

1)天珠图像模板生成单元,包括:

1.1)图像采集单元,从多个不同角度采集天珠图像;

1.2)特征提取单元,提取天珠图像的金字塔梯度直方图特征,得到特征模板文件;

1.3)存储单元,将特征模板文件存储到数据库;

2)基于天珠图像模板进行天珠身份认证单元,包括

2.1)实际图像采集单元,采集实际天珠图像;

2.2)数据传输单元,将所述实际天珠图像送到服务器;

2.3)辨识单元,计算所述提取天珠图像的金字塔梯度直方图特征与数据库中存储的特征模板文件中的天珠特征的距离,根据设定阈值辨识天珠身份。

本发明的有益效果:

1.对于天珠这类的非朗伯体,本发明能够克服不同光照环境下的特征匹配,特别地,解决了天珠在强光照射下出现镜面反射高光区域的特殊匹配问题;

2.克服了不同天珠图像采集设备的多分辨率差异造成天珠图像细节呈现不一致的问题,提高了身份辨识的精度;

3.对于天珠这样的类圆柱体或者类球体,不同拍摄视角采集的是不同的图像,本发明在实际天珠身份辨识时,能够匹配任意视角下拍摄的天珠图像,解决了多视角图像的匹配问题;

4.本发明识别算法简洁、实时性强,识别精度高,通过手机等便携图像采集设备,能够实现天珠身份的自动辨识,操作过程简单、高效,辨识结果客观、准确;

5.代替了专家学者的人工辨识过程,利于收藏者的个人信息和隐私保护;

6.本发明天珠身份辨识方法易于推广,便于天珠爱好者、初学者学习使用,对于天珠的历史价值传承和规范收藏市场起到了积极的促进作用。

附图说明

附图示出了本发明的示例性实施方式,并与其说明一起用于解释本发明的原理,其中包括了这些附图以提供对本发明的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。通过结合附图对本发明的实施例进行详细描述,本发明的上述和其它目的、特征、优点将更加清楚。

图1是短圆柱状的天珠;

图2是椭球状的天珠;

图3是长圆柱状的天珠;

图4是天珠图像模板视频采集装置;

图5是灰度直方图均衡示意图;

图6是双线性插值示意图;

图7是梯度直方图(hog)特征提取过程示意图;

图8是提取phog特征流程图;

图9是用户基于移动端便携设备天珠身份辨识过程示意图。

具体实施方式

下面结合附图和实施方式对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分。

需要说明的是,在不冲突的情况下,本发明中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本发明。

基于图像的天珠身份辨识具体实施分为两个阶段:一是天珠图像模板生成阶段;二是基于天珠图像模板进行天珠身份认证阶段。

(1)天珠图像模板生成

为了尽可能避免采集天珠图像时外界直射光照出现高光区域,采集环境使用多点柔和白光进行补光。

采集图像模板使用佳能(canon)eos5dsr相机,提供最大分辨率8688×5792,高于一般手机拍摄的分辨率。

为了降低多视角采集天珠图像的难度,采用将天珠放到转盘,相机保持不动的视频采集方式,进行旋转采集天珠图像。

上述采集方案如图4所示,图4是天珠图像模板视频采集装置图。

天珠视频采集完成后,将视频进行抽帧操作,满足天珠转一圈等间隔选取120帧,覆盖天珠全部视角图像。

由于背景区域选择灰色,天珠颜色由黑色、白色或黄色组成,然后通过颜色差异进行天珠与背景分割,所以得到天珠图像矩形区域。

最后,提取天珠图像矩形区域的金字塔梯度直方图特征。

1)对矩形区域进行归一化预处理:灰度归一化由灰度直方图均衡化得到,如图2所示,计算如式(1)和式(2)所示;大小归一化由双线性插值得到,如图3所示,计算如式(3)所示。

其中,k表示归一化预处理前矩形区域图像的灰度值,nk表示灰度级为rk的像素点个数,m和n表示图像高度和宽度,pr(rk)表示出现的概率,l表示均衡后灰度级数,sk表示直方图均衡后对应的值。

其中,x1、y1、x2、y2为坐标值,q11=(x1,y1)表示q11点坐标,同理q12=(x1,y2),q21=(x2,y1)和q22=(x2,y2)分别表示q12、q21和q22点坐标。f(q11)表示q11点像素灰度值,f(q12)表示q12点像素灰度值,f(q21)表示q21点像素灰度值,f(q22)表示q22点像素灰度值,计算得到点p=(x,y)的灰度值f(x,y)。

2)基于otsu(最大类间方差法)算法得到二值化阈值,再加上先验阈值得到最终阈值,并进行二值化,获得天珠纹理图像。otsu算法迭代求解使两类类间方差最大化的阈值,计算如式(4)所示。

其中,t为迭代求解阈值,ω0(t)和ω1(t)分别表示类别概率,表示类内方差。

最后迭代求解阈值t加上先验阈值t0得到二值化阈值t,如式(5)所示。

t=t+t0(5)

3)基于天珠纹理图像中求得每个像素点的梯度值和梯度方向,并将梯度方向量化为9个方向得到梯度直方图(histogramsoforientationgradients,hog)特征,如图7所示,计算如式(6)-式(9)所示。

其中,i表示灰度图像,表示卷积,gx、gy和g表示梯度值,α表示梯度方向。

4)将天珠纹理图像区域依据高宽比1∶1进行划分,共得到4个子区域,分别对4个子区域提取梯度直方图特征。

5)将上述每个子区域依据高宽比1∶1再进行划分,共得到16个子区域,分别对16个子区域提取梯度直方图特征。

6)将上述直方图顺序连接得到金字塔梯度直方图(pyramidofhistogramsoforientationgradients,phog)特征,其特征维数为(1+4+16)*9=189维特征向量,进行归一化,存储为特征模板文件用于后续天珠身份辨识。

上述提取天珠图像梯度直方图特征算法流程如图5所示。

(2)基于天珠图像模板进行天珠身份认证阶段

基于天珠图像模板进行天珠身份的认证是基于天珠图像phog特征模板进行的。具体包括如下步骤:

1)用户采用具有网络功能的便携图像采集设备(例如手机)拍摄一幅古珠图像,根据选择辨识天珠信息会出现与真实天珠比例的图像框辅助用户获取图像。

2)将图像框内天珠图像送到服务器后台,提取天珠图像矩形区域的金字塔梯度直方图特征,如图2所示。

3)计算所述提取天珠图像矩形区域的金字塔梯度直方图特征与数据库采集存储的真实天珠特征的chamfer距离,计算如式(10)所示;最后根据设定阈值进行辨识身份,如式(11)所示。

其中,xt和xm分别表示数据库天珠和用户上传待测天珠的phog特征,m表示特征维度,nm表示归一化常数。

其中,t1表示预先设定辨识阈值,id=1表示当前用户上传待测天珠与数据库录入天珠身份一致,同理,id=0表示当前用户上传待测天珠与数据库录入天珠身份不一致。上述计算方法在图像局部特征丢失的情况下,仍然可以得到鲁棒性的结果,克服了高光区域湮没图像细节的问题。

其中,步骤2)中还包括如下步骤:

2.1)先进行天珠图像的整体识别,利用采集到的整张天珠图像分析整体图案的梯度分布,与天珠模板库中的天珠图案的梯度分布进行匹配,得到相似值,对于相似值大于阈值的整张天珠图像,进入步骤2.2;

2.2)将整张天珠图像进行网络划分,其中,将天珠纹理图像区域依据高宽比1∶1进行划分,共得到4个子区域,分别对4个子区域提取梯度直方图特征;

2.3)将上述每个子区域依据高宽比1∶1再进行划分,共得到16个子区域,分别对16个子区域提取梯度直方图特征;

2.4)将上述直方图顺序连接得到金字塔梯度直方图(pyramidofhistogramsoforientationgradients,phog)特征,其特征维数为(1+4+16)*9=189维特征向量,进行归一化,得到天珠图像矩形区域的金字塔梯度直方图特征。

上述流程如图6所示。

采用上述基于图像金字塔梯度直方图的天珠身份辨识方法,通过构造金字塔梯度直方图特征,建立模板库;实际匹配过程中,计算提取的天珠图像矩形区域的金字塔梯度直方图特征与数据库采集存储的真实天珠特征的chamfer距离,能够克服天珠在强光照射下出现镜面反射的高光区域导致所述区域天珠图像细节被湮没的问题,提高了天珠识别精度;解决了天珠在强光照射下出现镜面反射高光区域的特殊匹配问题。建立模板库时,采用旋转采集天珠图像的方式,采集的图像具有多视角,基于多视角建立模板库,实际天珠身份辨识时,能够匹配任意视角下拍摄的天珠图像,解决了多视角图像匹配的难题。采用多分辨率的特征提取,克服了不同天珠图像采集设备的多分辨率差异造成天珠图像细节呈现不一致的问题,提高了身份辨识的精度。本发明的天珠身份辨识方法算法简洁、运算量小,实时性强,识别精度高,通过手机等便携图像采集设备,即可实现天珠身份的自动辨识,操作过程简单、高效,辨识结果客观、准确。本发明的天珠身份辨识方法能够代替专家学者的人工辨识过程,利于收藏者的个人信息和隐私保护。本发明的天珠身份辨识方法易于推广,利于天珠爱好者、初学者学习使用,对于天珠的历史价值传承和规范收藏市场起到了积极的促进作用。

至此,已经结合附图所示的优选实施方法描述了本发明的技术方案,但是,本领域技术人员应当理解,上述实施方式仅仅是为了清楚地说明本发明,而并非是对本发明的范围进行限定,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1