书法字识别方法

文档序号：6583780阅读：7582来源：国知局

专利名称：书法字识别方法
技术领域：
本发明涉及计算机数字图像分析，尤其涉及一种书法字的识别方法。
背景技术：
中国书法是ー门古老的汉字的书写艺术，从甲骨文、石鼓文、金文(钟鼎文)演变而为大篆、小篆、隶书，至定型于东汉、魏、晋的草书、楷书、行书等，书法一直散发着艺术的魅力。以汉字为依托，是中国书法区别于其他种类书法的主要标志。然而，由于长期的历史变革，又许多汉字的古今字形发生了非常大的改变，有些古代字体，如小篆等，普通用户大多无法辨认。为了解决这ー问题，就需要有一种书法字识别的方法，能快速把书法作品转换成为文本格式。目前，对于书法字的识别技术研究甚少，多采用基于形状内容的图像匹配技术，书法字在本质上是手写体汉字，因此手写体识别是与书法字识别相关的研究，与书法字识别比较接近的是脱机手写体识别。脱机手写体汉字识别又可分为有限字符集的识别和无约束的手写体汉字识别两类。有限字符集上的手写体识别多是采用模式识别或者分类的方法，用于イ—目封识别(Proceedings of the Fifth International Conference on DocumentAnalysis and Recognition(ICDAR1999)，1999:737-740)、车票识别(光电子技术，2003，23(4) =268270)和银行票据识别(计算机工程与应用，2003，39 (30) =219222.)等。无约束的手写体识别多采用模式识别的方法将字符与数据库中的模板进行匹配，找出最接近的模板，该模板代表的汉字即为识别结果。

发明内容
本发明的目的是为了克服上述现有方法对于用毛笔书写的书法字识别效果差，提供一种书法字识别方法。一种书法字识别方法，包括以下步骤:I)搜集互联网上的单个书法字图像，或者从整个书法作品图像里对书法字做最小包围盒切分得到单个书法字图像，得到单个书法字图像集合，然后标注单个书法字图像对应的汉字语义，存入特征数据库；2)对单个书法字图像进行ニ值化、去噪、归ー化处理，ニ值化时，先将单个书法字图像转为灰度图像后使用自适应迭代法，通过将新阈值置为旧阈值以上及以下两区平均值的中点不断迭代求取最佳阈值，ニ值化后的单个书法字图像为白底黒字的ニ值化颜色矩阵，微小区域的噪声使用数学形态学的方法去除，微小区域的斑点和划痕使用开运算去除，字体中的小孔洞使用闭运算填充，所述的归一化采用基于笔画穿越数均衡的非线性归一化方法，单个书法字图像归一化的目标大小是45X45像素点阵；3)将步骤2)处理后的单个书法字图像对应的书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点存入步骤I)的特征数据库，得到书法字识别特征数据库；
4)将待识别书法字图像按照步骤2)进行ニ值化、去噪、归ー化处理，然后提取包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点的特征；5)利用待识别书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值这三个特征比较书法字识别特征数据库里的数据，对书法字识别特征数据库里的单个书法字图像进行初步筛选，得到候选书法字图像；6)对候选书法字图像再利用书法字识别特征数据库里的书法字轮廓点的特征信息进ー步进行相似度计算，按相似度大小排列给出候选书法字图像；7)对步骤6)中按相似度大小排列给出的候选书法字图像进行权重计算，合并汉字语义相同的候选书法字图像，最后识别输出。所述的步骤2)中:单个书法字图像转为灰度图像时，假设某个像素点p顔色的RGB值为(p.red, p.green, p.blue),那么灰度值的计算公式为:p.grey=0.11 Xp.red+0.59Xp.green+0.30Xp.blue ；去噪时噪声块的最大尺寸被定义为3X3像素点，微小区域的噪声使用数学形态学的方法去除，其中的斑点和划痕使用开运算去除，字体中的小孔洞使用闭运算填充；归ー化时，令f (X，y)为归ー化之前M0XN0的单个书法字图像点阵，其中參数皆为自然数，Mtl表示单个书法字图像的像素宽度，Ntl表示单个书法字图像的像素长度，x=l，2，…M0，y=1，2，…N0，g(m，n)为归ー化之后M1XN1的单个书法字图像点阵，m=l，2，...M1,n=1,2,...N1，令d(x，y)为单个书法字点阵图像f(x，y)在点(x，y)的笔划密度函数，定义为:
权利要求
1.种书法字识别方法，其特征在于，包括以下步骤: 1)搜集互联网上的单个书法字图像，或者从整个书法作品图像里对书法字做最小包围盒切分得到单个书法字图像，得到单个书法字图像集合，然后标注单个书法字图像对应的汉字语义，存入特征数据库； 2)对单个书法字图像进行ニ值化、去噪、归ー化处理，ニ值化时，先将单个书法字图像转为灰度图像后使用自适应迭代法，通过将新阈值置为旧阈值以上及以下两区平均值的中点不断迭代求取最佳阈值，ニ值化后的单个书法字图像为白底黒字的ニ值化颜色矩阵，微小区域的噪声使用数学形态学的方法去除，微小区域的斑点和划痕使用开运算去除，字体中的小孔洞使用闭运算填充，所述的归一化采用基于笔画穿越数均衡的非线性归一化方法，单个书法字图像归一化的目标大小是45X45像素点阵； 3)将步骤2)处理后的单个书法字图像对应的书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点存入步骤I)的特征数据库，得到书法字识别特征数据库； 4)将待识别书法字图像按照步骤2)进行ニ值化、去噪、归ー化处理，然后提取包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点的特征； 5)利用待识别书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值这三个特征比较书法字识别特征数据库里的数据，对书法字识别特征数据库里的单个书法字图像进行初步筛选，得到候选书法字图像； 6)对候选书法字图像再利用书法字识别特征数据库里的书法字轮廓点的特征信息进一步进行相似度计算，按相似度大小排列给出候选书法字图像； 7)对步骤6)中按相似度大小排列给出的候选书法字图像进行权重计算，合并汉字语义相同的候选书法字图像，最后识别输出。
2.据权利要求1所述的ー种书法字识别方法，其特征在于，所述的步骤2)中:单个书法字图像转为灰度图像时，假设某个像素点P颜色的RGB值为(p.red, p.green, p.blue)，那么灰度值的计算公式为:p.grey=0.11 Xp.red+0.59Xp.green+0.3Xp.blue ；去噪时噪声块的最大尺寸被定义为3X3像素点，微小区域的噪声使用数学形态学的方法去除，其中的斑点和划痕使用开运算去除，字体中的小孔洞使用闭运算填充；归一化时，令f(x，y)为归ー化之前MtlXNtl的单个书法字图像点阵，其中參数皆为自然数，Mtl表示单个书法字图像的像素宽度，Ntl表示单个书法字图像的像素长度，x=l，2，…Mc^y=I, 2，…N。，g(m，n)为归ー化之后M1XN1的单个书法字图像点阵，m=l，2,…M1, n=l, 2，…N1,令d(x, y)为单个书法字点阵图像f(x，y)在点(x，y)的笔划密度函数，定义为: ^ 、 [1，黒色象素 d{x,y) = <，[0,白色象素令H(X)，V(y)分别为密度函数在水平和垂直方向上的密度投影，则有: H(x) = > d{x,y)， V(y) =ァ) X=Iヌ=1归ー化算子写作:
3.据权利要求1所述的ー种书法字识别方法，其特征在于，所述的步骤3)得到的书法字识别特征数据库包括:单个书法字图像对应的汉字语义；记录书法字最左最上、最右最下、最上最左和最下最右四个边界点坐标依次为left_top、right_down、top_left和down_right ;书法字的笔画穿越数指扫描线在扫描书法字时候穿透的笔画个数，用ー组垂直扫描线从左到右扫描ニ值化后的书法字图像，每当扫描线上像素点顔色由白变黑，即在对应的ニ值矩阵中，扫描线方向上的值由O变1，扫描值就加1，当扫描线穿过的第一个像素点为黑色吋，扫描值也加1，扫描值是垂直笔画穿越数，所有垂直扫描线上笔画穿越数的平均值是垂直方向平均笔画穿越数，同样计算出水平方向平均笔画穿越数；书法字的投影值就像太阳照在物体上一祥，从书法字的投影值大致判断出物体的大小，用x+y两个方向的投影值，X方向45个点，y方向45个点，两个串接在一起表示投影值；对书法字轮廓进行提取，书法字的一个轮廓点有X，I两个坐标值，用于匹配形状。
4.据权利要求1所述的ー种书法字识别方法，其特征在于，所述的步骤5)包括:对待识别书法字与数据库中的每个候选书法字的四个边界点位置逐个比较，分别计算待识别书法字四个边界点与数据库中的每个候选书法字四个边界点相差的距离dist_left、dist_right、dist_top、dist_down,计算如下:
5.据权利要求1所述的ー种书法字识别方法，其特征在于，所述的步骤6)包括:对单个书法字图像中书法字轮廓上的任意点Pi,构造以Pi为中心的极坐标系，坐标系将整个空间从方向上平均划分出8个方向，在弦上按近似log2r的宽度把半径划为4份，这样，整个空间就被划分为32个区域，即32个bin，计算落入每个区域的像素点个数Wi(k)，其中k=l, 2，…，32，形成ー个32维的向量；整个书法字与ー个n行32列的矩阵相对应，如下所
6.据权利要求1所述的ー种书法字识别方法，其特征在于，所述的步骤7)包括:当上述步骤6)所得到的形状相似候选书法字图像中存在汉字语义相同的候选书法字图像吋，为了统计得到识别結果，对每个候选书法字图像根据其排序和相似度赋予权重，记输入的候选书法字图像中书法字为I。，ニ值化的书法字为Ctl，进行相似度计算得到的前N个结果为I1,I2,…，IN，其ニ值化的书法字为C1, C2,…，Cn,则每个结果的权重8 , (i=l, 2，…，N)定义如下:
全文摘要
本发明公开了一种书法字识别的方法。搜集单个书法字图像，人工标注单个书法字图像对应的汉字语义，对单个书法字图像进行二值化、去噪和归一化处理后提取单个书法字图像中书法字的特征信息，存入特征数据库，特征信息包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、投影值、轮廓点，之后对待识别的单个书法字图像也进行处理，提取待识别书法字的特征信息，初步筛选后，再进行形状匹配比较，筛选出特征数据库里与待识别书法字形状相似的书法字，最后进行权重计算、合并汉字语义相同书法字图像，给出识别结果。本发明计算量小，能够在较短时间内给准确的识别结果；对用户所提供的待识别书法字图像没有具体要求。
文档编号G06K9/62GK103093240SQ201310020510
公开日2013年5月8日申请日期2013年1月18日优先权日2013年1月18日
发明者庄越挺, 吴江琴, 林媛, 高鹏程, 夏洋申请人:浙江大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：庄越挺;吴江琴;林媛;高鹏程;夏洋
技术所有人：浙江大学
我是此专利的发明人

上一篇：一种自适应视线跟踪系统的制作方法
上一篇：基于机器视觉的磁瓦表面缺陷特征提取及缺陷分类方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。