一种基于提取颜色特征的古代壁画分类识别方法与流程

文档序号:12178085阅读:1102来源:国知局

本发明属于计算机模式识别技术,具体涉及一种古代壁画图像的识别。



背景技术:

古代壁画识别就是应用计算机模式识别技术将壁画归入所属的类别之中,进而判断出壁画作品的绘制风格、创作年代以及所属的地域。由于古代壁画图像内容丰富,信息繁多,因此,要准确选定需要识别的对象,并针对不同的问题提出相应的解决方案。“壁画图像分类中的分组多实例学习方法”,唐大伟等,中国图象图形学报第19卷第708-715页,2014年5月记载了一种壁画图像的分组多实例学习方法,该方法根据壁画图像自身的特点提出分组策略,将样本空间划分为不同的子空间,每个子空间单独训练分类模型,一定程度地解决了样本在总体不可分、但局部可分的情况造成的分类误差。该方法分类识别的正确率为82.21%。

博士学位论文“基于艺术风格的绘画图像分类研究”,杨冰2013年6月,第1-113页,提出了一种基于艺术风格相似性规则的绘画图像分类方法。针对敦煌壁画的识别方法是根据图像不同类别的特征进行分类,例如将壁画分为形、色、光照三种不同特征,并用50张进行训练,图像分类的结果为:构成属性75%,色彩属性0.64%,光照属性0.66%,最后所有属性累加识别正确率为78%。

以上第一种方法根据壁画图像自身的特点提出分组策略,识别正确率为82.21%。第二种方法将形、色、光照三种方法结合,识别正确率为78%。现有技术的不足之处在于:识别正确率较低,有必要提高识别正确率。

技术术语:

数据点:指一幅图像中的一个像素点。

代表点:指从每幅图像中提取的最有代表性的像素点。



技术实现要素:

本发明所要解决的技术问题就是提供一种基于提取颜色特征的古代壁画分类识别方法,它能提高古代壁画图像识别的正确率。

本发明所要解决的技术问题是通过这样的技术方案实现的,它包括以下步骤:

步骤1、获取图像的RGB颜色信息,并将其转化到HSV颜色空间;

步骤2、将图像的HSV颜色空间进行非等间隔量化;

步骤3、统计得到图像的HSV颜色统计直方图,作为图像的颜色特征向量;

步骤4、归一化特征向量;

步骤5、在图像库中,按照步骤1~4处理每个图像,得到各图像所对应的特征向量;

步骤6、对于每个类,使用kmeans算法提取该类的代表点;

步骤7、对于每个数据点,计算数据点的特征向量与每个代表点的特征向量的相似度,并根据代表点的类对数据点对应的图像进行归类。

优选地,本发明还包括:

步骤8、对于每个验证图像,根据已确定的分类和步骤7分类的结果,计算分类的正确率。

本发明的技术效果是:提高了古代壁画图像识别的正确率。

具体实施方式

下面结合附图和实施例对本发明作进一步说明:

本发明包括以下步骤:

步骤1、获取图像的RGB颜色信息,并将其转化到HSV颜色空间;

由于RGB颜色空间是一种与硬件设备相关的色彩空间,它与人类视觉系统对颜色相似性的主观判断不符合,从RGB颜色空间中很难知道该值所表示颜色的认知属性,因此在图像分析的过程中,通常将RGB颜色空间转换到符合人类视觉感知的HSV颜色空间。

步骤2、将图像的HSV颜色空间进行非等间隔量化;

将H、S、V三个分量按照人的颜色感知进行非等间隔量化,非等间隔量化就是对颜色空间中每一通道的划分不采用等分的方法,而是人为的划分其通道的大小。对图像颜色空间进行非等间隔量化可以使颜色的度量方式更符合人眼对颜色的认知和判断。本步骤采用的非等间隔量化方式是把HSV颜色空间的色度分量H沿分布轴分为8个空间,把饱和度S分为3个空间,亮度分量V分为3个空间,即划分比例为H∶S∶V=8∶3∶3。即色调H分成8份,饱和度S和亮度V各自分成3份,把得到的3个颜色分量合成一维特征矢量,按照H、S、V三个分量在颜色感知中对视觉特征影响的重要程度分别给予不同的权重:

G=9H+3S+V

上式中G表示颜色特征量化集,H表示为0~7的色调分量;S表示为饱和度分量0~2;V表示为亮度分量0~2;这样H、S、V,三个颜色分量在一维矢量上分布开来,G的取值范围为[0~71]。

步骤3、统计得到图像的HSV颜色统计直方图,作为图像的颜色特征向量;

为了利用图像的颜色特征描述图像,可借助颜色特征的统计直方图。图像颜色特征的统计直方图实际是一个一维的离散函数,即:

上式中,H为概率,K为G中任一元素,取值范围是颜色特征值为0~71;nK是图像中具有颜色特征值为K的像素的个数,N是图像像素的总数。

对G进行统计后,图像获得了72个颜色分量的一维特征向量,并将该一维特征向量作为图像的特征向量。

步骤4、归一化特征向量;

归一化特征向量是把特征向量里的各个值同除以其中的某一个值,一般除以最大值。

步骤5、在图像库中,按照步骤1~4处理每个图像,得到各图像所对应的特征向量;

步骤6、对于每个类,使用kmeans算法提取该类的代表点;

图像的类别即同一地域中拍摄到的壁画图片为同一类,不同地区拍摄到的图片为不同类,譬如:敦煌壁画为一类,新疆壁画为另一类。

由于每个类的图像颜色特征不太统一,故使用多个颜色特征向量来代表该类的颜色特征。对于每个类,使用kmeans算法进行聚类,将聚类后的簇点作为类的代表点。因此,kmeans算法中选择k值对于分类效果有很大的影响。

kmeans算法如下:

初始随机选择k个初始点,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值,这里的簇心即为类别的代表点。簇的个数是由用户设定的。

以355张广元觉剑阁苑寺壁画为类别1为例,包括以下步骤:

1、从类别1中的355张壁画图像中随机选k个图像作为初始中心;

2、计算其余壁画图像分别和初始中心点的距离,跟哪个初始中心近就跟那个中心点归为一类(使用欧式距离来作为距离的度量方式),直到将355张壁画图像被完整的分为k个簇;

3、在分好类的基础上按平均值的方法重新计算聚类后簇的中心点,再重复步骤2;

4、直到最后算法收敛(即簇心不再变动)则结束,得输入是:类别1中的355张笔画图像的HSV颜色特征、代表点数量K个簇中心点(即为类别1的k个代表点)。

kmeans算法是直接调用matlab的函数kmeans,函数kmeans的输入是:类别1中的355张笔画图像的HSV颜色特征和代表点数量k,则函数kmeans的输出为类别1(广元觉剑阁苑寺壁画)的k个代表点。

类的代表点个数是经多次实验后选择出来的,它因壁画内容的不同而完全不同。例如,根据发明人自建的壁画图像数据库,四川壁画图像数据库中的广元剑阁觉苑寺壁画、广汉龙居寺壁画、新津观音寺壁画、新繁龙藏寺壁画和蓬溪宝梵寺壁画五类壁画图像的类代表点数量分别为:4、2、6、2、3。全国壁画图像数据库中的云南丽江白沙壁画、北京法海寺壁画、山西永乐宫壁画、四川地区壁画、新疆克孜尔壁画、敦煌莫高窟壁画、西藏壁画七类图像的类代表点数量分别为:19、4、3、15、28、25、16。

步骤7、对于每个数据点,计算数据点的特征向量与每个代表点的特征向量的相似度,并根据代表点的类对数据点对应的图像进行归类;

本步骤采用直方图相交法进行特征向量的相似度计算。直方图相交法是将待识别图像提取颜色直方图,计算与数据库中每一幅图像颜色直方图之间的距离(每幅图像都是图像库中的已知图像),距离在一定范围内的图像即为被判断为同一类别的图像。

直方图相交法的过程是:

H1(K)和H2(K)分别为两幅图像颜色特征为K的统计直方图,则两图像之间的匹配值P可借助直方图相交来实现,即:

上式中,P表示两幅图像颜色特征的直方图相似度;是图像颜色特征值从0~71的累加求和,min[H1(K),H2(K)]表示取两个值中的最小值。H1(K)和H2(K)指两幅图像颜色特征从G中取值为K的概率。该公式定义了求取两幅图像直方图相交的最小值。

根据直方图相似度P的归类方法为:提取待识别图像的颜色直方图,通过比较两幅图像相交中的最小值,计算出待识别图像与数据库中图像颜色直方图之间的距离,然后将距离邻近的图像归入到同一类别。

每个图像都有代表点,那么每一类图像在颜色分值上的共性即类代表点,本步骤使用最邻近算法(k-Nearest Neighbor,简称KNN)进行分类,也就是,依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

步骤8、对于每个验证图像,根据已确定的分类和步骤7分类的结果,计算分类的正确率。

验证图像是在已知图像的正确分类后,再用本发明进行分类,计算本发明的正确率。分类准确率计算包括三部分内容:1.计算正确的分类;2.计算错误的分类;3.计算正确识别率的百分比。

实施例

本发明应用于四川壁画图像的识别,对于四川壁画图像而言,颜色信息是整幅图像最具代表性的视觉信息,而同一类壁画中又可以分出多个不同的色彩特征。在本方法发明中,计算数据点与代表点的相似度,从而将数据点归类为最邻近代表点对应的类别,实施壁画图像的自动分类。

采用本方法发明的测试结果是:四川壁画图像系统识别的平均准确率达到88.86952%,全国壁画图像平均识别正确率为87.7160671%,经多次实验逐渐提升为88%左右。

与现有技术相比,本发明具有如下的优点:通过壁画色彩的特征提取,实现了种类繁多、风格复杂的壁画图像的自动分类,并且提高了识别的正确率。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1