一种用于手写汉字的美化方法

文档序号:6482160阅读:379来源:国知局

专利名称::一种用于手写汉字的美化方法
技术领域
:本发明属于利用计算机处理识别进行手写汉字识别及美化领域,特别是涉及一种用于楷书体手写汉字的笔画特征美化方法。
背景技术
:手写体汉字美化是一种将联机手写体轨迹变化成一种有风格的图像的方法。一般而言,联机手写体轨迹都不具有风格,仅仅是一些时序点序列。一个笔画就是一个点序列;汉字可以认为是一系列点序列的组合。手写体美化就是要将这些点序列变成有某种风格的图像。楷书体美化是要将手写体点序列变成楷书体风格图像。楷体被认为是标准的汉字书法体,又称"正书",其风格体现在笔画段的瘦劲有力及笔画段连接处的明显突兀。它是最常见的汉字书法体。以往的汉字美化多采用数字墨水技术对手写体轨迹进行简单处理。中国专利申请号为200410063987.8的《用于识别,锚定和回流数字墨水注释的数字墨水注释方法和系统》保留位于一个文档中的注释位置,以使注释的原始的意图和意向能被保留。中国专利申请号为200510069577.9的《激光笔的数字墨水生成方法与生成系统》;另有中国专利申请号为01819444.3的《数字墨水的压縮》提出了一种节省数字墨水存储量的方法。均属于此种技术。中国专利申请号为200810028916.2釆用模板匹配的方法对手写体汉字进行美化,可以将汉字美化成与模板相同的风格,但它仅能对整个汉字进行美化,而不能对某一个笔画进行美化。并且涉及到了汉字识别技术,难以实现实时美化。屮国专利申请号为200810121201.1的《一种手写体汉字的计算机生成与美化方法》是一种汉字生成方法,先进行风格学习,再将书写的汉字美化成已有的风格。涉及汉字美化度评价及新风格的适配方法。同样也具有难以实时的问题。
发明内容本发明的目的在于克服上述汉字美化方法的不足,提供一种通过对笔画特征建模的方法对手写体进行美化。本发明采用的技术方案为一种用于手写汉字识别的笔画特征美化方法,包括如下步骤(1)、对手写汉字的点序列进行插值处理,插值后的点序列为空间上连续的笔画曲线;(2)、提取笔画的拐点信息,并根据拐点把笔画分段;(3)、建立汉字笔画中的笔画段模型;(4)、建立汉字笔画中的连接件模型;(5)、根据笔画段及连接件组合规则,对手写汉字笔画时序点序列的方向信息采用步骤(3)和(4)中的笔画段和连接件模型进行渲染,从而完成对笔画的美化。、上述技术方案中,所述步骤(1)采用数字微分法DDA进行插值处理。所述步骤(2)采用自适应弯曲值法找出笔画曲线中的拐点,并以所述拐点对笔画曲线进行分段。步骤(2)所采用的自适应弯曲值法中,计算弯曲值BendingValue的表达式为&=腿(卜,.^—《)+(《"-义,)|,|(y,._A—_y,.)+0^—_v,)|),其中(x,,_y,.),(x,4,乂一》和"",力")分别为S,&*,^的坐标,k的值为《的支撑域,^,《"分别为它的前k点和后k点。该算法的步骤包括(A)、将属于直线段的点去除,方法是对于S,《-',^'三点,判断《-',^两点的斜率和《,^两点的斜率是否相同,或判断它们之间的链码是否相同,如相同,证明这三点是在同一直线上,将这些不可能是拐点的直线上的点排除,剩余的点作为侯选点;(B)、计算侯选点的BendingValue,支撑域k从l开始,用^表示当支撑域的大小为k时,第i点的BendingValue。如果^^',"1,k值增加1,否则k值停止增加,为所求的支撑域大小;1—二丄y~(C)、应用公式,算出每一侯选点的BendingValue;(D)、根据以下条件得出符合条件的拐点根据以下条件得出符合以下条件之一,就排除它是拐点条件h^'",这里s为1.1;条件2:卜<^,对于_/=!'-1或_/="1;条件3:并且&<、1;条件4:^=—+1,并且^^'";条件1表示BendingValue应大于阈值,条件2、3、4表示求出的拐点的BendingValue应为局部最大值,否则就排除。通过条件1到4,筛选出拐点(不符合条件1到4的任意一条)。此算法的优点是能根据曲线的不同特点自适应调整支撑域。所述步骤(3)归纳了三种笔画段,分别是(1)、两头粗,中间细型;(n)、渐细型;(III)、渐粗型;所述三种笔画段具体模型建立如下根据拐点信息,把笔画段用最小二乘法拟合成三阶贝塞尔曲线;根据笔画段类型以及拐点附近点方向信息,给拟合后的贝塞尔曲线添加宽度信息;沿着添加了宽度信息的贝塞尔曲线画出不同半径的圆,完成对各种笔画段8模型的建模;其中,所述宽度信息确定如下令笔画段的宽度为W,对于I型,设定始末两端的宽度为W,距离始端1/2位置的宽度为0.7W;对于II型,设定始端的宽度为w,距离始端1/2位置的宽度为0.7w,末端的宽度为O;对于III型,设定始端的宽度为O,距离始端1/2位置的宽度为0.7w,末端的宽度为w。所述步骤(4)归纳出了九种连接件,分为如下三类独体连接件,仅包括"点"连接件;单向连接件,包括"横头"、"横尾"、"竖头"、"竖尾"、"捺头"、"捺尾"6种;双向连接件,包括"横折"和"竖提"2种;所述独体连接件用于"点"笔画的美化,所述单向连接件用于笔画的起笔及收笔处的美化,所述双向连接件用于笔画中相邻笔画段的连接处美化。所述步骤(5)确定了笔画表达式如下笔画=(&起笔连接件)+笔段+《b:中间连接件+笔段}+(&收笔连接件)其中,《W表示b出现0次或多次,(a)表示a出现O次或l次,起笔连接件指位于笔画起笔处的连接件,收笔连接件指位于笔画收笔处的连接件,中间连接件指除去起笔连接件和收笔连接件的其它连接件。所述步骤(5)将笔画分为如下两大类简单笔画没有拐点的笔画,包括"横"、"竖"、"撇"、"捺"、"点"、"提";复合笔画除6种简单笔画外的其它所有笔画,是简单笔画的复合。所述步骤(5)对手写汉字笔画进行渲染的步骤包括(51)、判断输入笔画的点数,如果点数少于30,判断笔画为点,用独体连9接件进行渲染,结束;(52)、如果点数多于30,再判断步骤(2)中提取到的拐点数,如果拐点数为2,说明笔画只有笔画头和笔画尾两个拐点,判断该笔画为简单笔画,进行简单笔画渲染,结束;(53)、对于其他的复合笔画,进行普通的复合笔画渲染,结束。所述步骤(5)进一步包括对笔画段拟合的方法,其具体步骤如下-(A)、将插值处理后的点序列进行最小二乘法贝氏拟合,得到拟合后的贝氏曲线,同时得到最大拟合误差位置及误差值;若误差值大于某一阈值,则将原曲线分为两段曲线,并分别再次拟合,直到误差小于阈值。(B)、依据不同类型的笔画段,分别赋予原始点序列每个时序点不同的宽度信息,分别得到三种宽度信息;(C)、将贝氏曲线分为5段,分别为,0,0.25,0.5,0.75,1处的5个端点,并求取这5个点处的宽度,这个宽度是距离原始曲线最近的那个点的宽度;(D)、用变宽贝氏曲线的反走样画法将含变宽信息的贝氏曲线表达出来,依据步骤(C)中赋予的宽度,在每个曲线点处用相应宽度的反走样圆进行渲染,最终得到美化后的笔画段。所述步骤(5)还包括对连接件的渲染操作,具体如下所有的连接件均用若干段贝塞尔曲线拟合连接件的轮廓,记录其坐标点;根据实际笔画的参量,通过二维图形的平移、旋转、縮放三种基本变换方法,将其适配到目标位置,最终用泛填法填充轮廓内部,完成连接件的渲染;其中对于独体连接件,笔画的参量包括书写方向、长度、宽度;对于单向连接件,笔画的参量包括相连笔画段书写方向、相连笔画段的宽度;对于双向连接件,笔画的参量包括第一笔画段书写方向、第一笔画段宽度、第二笔画段书写方向、第二笔画段宽度。发明的基本原理是经过大量的观察,发现每一种字体都有自己的风格,而风格主要体现在笔画的粗细变化、笔画拐弯处的停顿、起笔处的停顿、收笔处的笔锋等等。以上的这些风格的表现,统一称为汉字的皮肤。将汉字的骨架蒙上皮肤,就赋予了一种风格。而在具体的汉字美化实现过程中,皮肤是由笔段和连接件构成的。笔段就是汉字中的一段段笔画,并为之蒙上皮。连接件就是起笔、落笔以及拐弯等处的连接顿笔。只要对手写字体,特别是楷书字体中出现的笔段和连接件建模,然后将它们按照原字中的笔段和拐点位置拼接起来就可以实现手写汉字美化。这就是本发明中汉字美化的基本思想。图l是本发明的系统结构框图2是本发明的3种笔画段类型图图3是本发明的笔画段拟合方法图图4是本发明的9种连接件分类图;图5是本发明的独体连接件建模说明图;图6是本发明的单向连接件建模说明图;图7是本发明的双向连接件建模说明图;图8是本发明的复合笔画渲染示意图;图9是本发明的复合笔画渲染流程图;图IO是本发明的手写汉字楷书美化效果图。具体实施例方式下面结合附图对本发明做进一步的说明,实施本发明所用的识别设备可以采用手写板或者鼠标书写汉字,用PC显示器或者LCD显示屏显示用户图形界面,可采用0++语言编制各类处理程序,便能较好地实施本发明。本发明的系统结构框图如附图1所示,该系统分为两个模块。当用户输入手写汉字后,系统进入第一个模块预处理模块。该模块的作用是对用户手写输200910042119.4提供必要的参数。该模块由两部分组成,第一部分是对用户的笔画进行DDA插值,第二部分是对用户输入的笔画进行拐点提取。然后系统进入第二个模块主美化模块,首先计算笔画所属的类型,然后根据组合规则选取连接件和笔画段进行组合,完成渲染。该模块是整个系统的主体。本发明建模的笔画段如附图2所示,分为两头粗,中间细型(I型)、渐细型(II型)和渐粗型(III型)。其拟合方式如附图3所示,包括下面4个步骤1)将原始轨迹(DDA插值后)进行最小二乘法贝氏拟合,将得到拟合后的贝氏曲线。图3中C1C4为贝氏曲线的4个控制点。同时,拟合结果将得到最大拟合误差位置及误差值。2)依据不同类型的笔段,分别赋予原始曲线每个时序点不同的宽度信息。分别可以得到三种宽度信息。假设预设笔段的宽度为w(也就是均匀粗细时的宽度)。对于I型,设定始末两端的宽度为w,距离始端l/2位置的宽度为0.7w。对于II型,设定始端的宽度为w,距离始端1/2位置的宽度为0.7w,末端的宽度为O。对于m型,设定始端的宽度为O,距离始端1/2位置的宽度为0.7w,末端的宽度为w。3)将贝氏曲线分为5段,分别为1=0,0.25,0.5,0.75,l处的5个端点,如图3中的P1P5。求取这5个点处的宽度,这个宽度是距离原始曲线最近的那个点的宽度。4)用变宽贝氏曲线的反走样画法将含变宽信息的贝氏曲线表达出来。本发明建模的9种连接件分类图如附图4所示,下面对这些连接件进行介绍(A)、独体连接件只有"点"一种,这种连接件实质并不用于连接笔画段,而是将整段笔画变为点。(B)、单向连接件包括"横头"、"横尾"、"竖头"、"竖尾"、"捺头"、"捺尾"6种。这种连接件用于笔画的起笔或收笔处,所以又可以称为"末稍连接件"。(C)、双向连接件有"横折"和"竖提"2种,这种连接件主要用于笔画中笔段与笔段的连接处,所以又可以称为"关节连接件"。本发明中的独体连接件建模说明图如附图5所示,其实本发明中四种连接件的建模都可分以下两个步骤,不同点仅仅是贝塞尔曲线控制点参数读取的方法,独体连接件建模步骤如下(a)、在绘图工具中用若干段贝塞尔曲线逼近连接件轮廓利用绘图软件的贝氏曲线绘制工具对"点"的轮廓进行建模。通过观察,其轮廓曲线可以用3段贝氏曲线拼接而成,如附图5所示。将这3段曲线的控制点坐标记录下来,在程序中利用贝氏曲线的画法就可以将其画出;(b)、连接件的縮放、旋转以平移连接件在最终渲染过程中要根据笔段的方向以及粗细调整自身的大小和方向,然后将整个模型移动到笔画实际的位置中去。这就需要对连接件模型做縮放以及旋转;(c)用泛填法填充轮廓内部,完成连接件美化。本发明中的单向连接件建模说明图如附图6所示,单向连接件是处于笔段一端的连接件,可能处于笔段的开始,也可能处于结尾。图形绘制的方法和縮放的方法与独体连接件的方法都相同,对于旋转参数,依附图6所示,在建模时设定默认起笔方向是90度,那么只需将用户的手写方向减去90度就是需要旋转的方向。其余的连接件是类似的。本发明中的双向连接件建模说明图如附图7所示,双向连接件是连接两段笔画的重要连接部件。下面以楷书"横折"为例,说明双向连接件的建模过程。对于"横折",能控制以下参量13A、入端宽度(wl)B、出端宽度(w2)C、入端角度(al)D、出端角度(a2)al和a2即为In与Out矢量的方向角。从汉字笔画的原始轨迹可以求出in与out矢量间的旋转角,记为9。得下面的几何关系。'a==arctan(w2/2/1OT|)1041=|oc|=Vior|2+(w2/2)2,=|Q/41.cos(P_)f:v^=+1爿51cos(0+;r)^k=力+1^I'sin^+幻;这里设定IAB卜i.2,同理^l少c=|OC|'sin((9+").fxD=jcc+ICD卜cos(P+;r)^U〃c+ICD卜si牵+;r),这里设定!CD卜o.6。其它参量从附图7中直接读取即可。这样,加上全局比例縮放和全局旋转就可以将其应用到建模中了。本发明将汉字笔画分为两大类简单笔画和复合笔画。如附图8所示,包括简单笔画没有拐点的笔画,包括"横"、"竖"、"撇"、"捺"、"点"、"提,,;复合笔画除去上面6种的其它所有笔画。它们可以认为是简单笔画的复合。本发明中的简单笔画渲染规则如表1所示。表1简单笔画判断规则<table>tableseeoriginaldocumentpage15</column></row><table>上表中,total表示笔画的总点数,cornercnt是检测到的拐点数,2个拐点是指首点和末点,curvature指曲率,表征笔画的弯曲程度,dir是首点到末点的角度。本发明中的复合笔画渲染流程图如附图9所示,对于复合笔画,主要关注3个方面1)起笔及起笔段的美化规则;2)收笔及收笔段的美化规则;3)拐弯处使用的连接件及其相连的笔段的美化规则。以附图9所示的"横折钩"为例,它有4个拐点(包括始末两点),将笔画分为3个笔段。其中第一个笔段为横,则将其美化为横头+I型笔段;第二个笔段为中间笔段,一律用I型笔段美化;Sl和S2连接处的连接件应采用"横折"连接件;S3是收笔段,应该采用II型笔段美化。S2和S3连接处的连接件应选用"竖钩"连接件。这就是美化过程。具体而言,连接件的选用和笔段的选用都是根据笔段方向进行判定的。如图50,在每个关键点(拐点)处,将它和它附近不远处(本方案选择25个点的间隔)的那个点构成的矢量作为这一点的关键方向,如图中的Orii。对于单向连接件,比如第一个拐点处,只需要关注Oril,就能决定采用何种连接件。而对于多向连接件,如第2和第3个拐点处,就需要关注与之相关的两个方向。将规则总结为表2和表3。表2笔段的选取规则笔段类型规则起笔处的方向用Ori0,收笔处的方向用OriN,双向用Oril,Ori2表示入和出矢量I型1、起笔OriOEU[350,360]2、中间笔段一律用I型3、收笔OriNGU[350,360]并且曲线长leiKl28II型除i,ni型外,其它全部美化为n型III型1、起笔OriOE[30,70]2、收笔OriNG[O,10]U[350,36Q]并且曲线长len〉128表3连接件的选取规则连接件类型规则起笔处的方向用Ori0,收笔处的方向用OriN,双向用Oril,Ori2表示入和出矢量竖钩1、Oriie[45,145]且Ori2E[180,250]2、OrilGU[240,360]且Ori2e[225,300]横折1、OrileU[315'360]且Ori2e[80,180]2、Orile[60,170]且Ori2EU[290,360]本发明的手写汉字楷书美化效果图如附图io所示。1权利要求1、一种用于手写汉字的美化方法,其特征在于包括如下步骤(1)、对手写汉字的每个笔画上的原始点序列进行插值处理,插值后的点序列为空间上连续的笔画曲线;(2)、提取笔画的拐点信息,并根据拐点把笔画分段;(3)、建立汉字笔画中的笔画段模型;(4)、建立汉字笔画中的连接件模型;(5)、根据笔画段及连接件组合规则,对手写汉字笔画时序点序列的方向信息采用步骤(3)和(4)中的笔画段和连接件模型进行渲染,从而完成对笔画的美化。2、根据权利要求1所述的用于手写汉字的美化方法,其特征在于所述步骤(1)采用数字微分法进行插值处理。3、根据权利要求1或2所述的用于手写汉字的美化方法,其特征在于所述步骤(2)采用自适应弯曲值法找出笔画曲线中的拐点,并以所述拐点对笔画曲线进行分段。4、根据权利要求3所述的用于手写汉字的美化方法,其特征在于所述步骤(3)归纳了三种笔画段,分别是-(I)、两头粗,中间细型;(II)、渐细型;(III)、渐粗型;所述三种笔画段具体模型建立如下根据拐点信息,把笔画段用最小二乘法拟合成三阶贝塞尔曲线;根据笔画段类型以及拐点附近点方向信息,给拟合后的贝塞尔曲线添加宽度信息;沿着添加了宽度信息的贝塞尔曲线画出不同半径的圆,完成对各种笔画段模型的建模;其中,所述宽度信息确定如下-令笔画段的宽度为w,对于I型,设定始末两端的宽度为w,距离始端1/2位置的宽度为0.7W;对于II型,设定始端的宽度为w,距离始端1/2位置的宽度为0.7w,末端的宽度为O;对于III型,设定始端的宽度为O,距离始端1/2位置的宽度为0.7w,末端的宽度为w。5、根据权利要求4所述的用于手写汉字的美化方法,其特征在于所述步骤(4)归纳出了九种连接件,分为如下三类独体连接件,仅包括"点"连接件;单向连接件,包括"横头"、"横尾"、"竖头"、"竖尾"、"捺头"、"捺尾"6种;双向连接件,包括"横折"和"竖提"2种;所述独体连接件用于"点"笔画的美化,所述单向连接件用于笔画的起笔及收笔处的美化,所述双向连接件用于笔画中相邻笔画段的连接处美化。6、根据权利要求5所述的用于手写汉字的美化方法,其特征在于所述步骤(5)确定了笔画表达式如下笔画=(3:起笔连接件)+笔段+(b:中间连接件+笔段}+(&收笔连接件)其中,(b)表示b出现0次或多次,(a)表示a出现O次或l次,起笔连接件指位于笔画起笔处的连接件,收笔连接件指位于笔画收笔处的连接件,中间连接件指除去起笔连接件和收笔连接件的其它连接件。7、根据权利要求6所述的用于手写汉字的美化方法,其特征在于所述步骤(5)将笔画分为如下两大类简单笔画没有拐点的笔画,包括"横"、"竖"、"撇"、"捺"、"点"、"提";复合笔画除6种简单笔画外的其它所有笔画,是简单笔画的复合。8、根据权利要求7所述的用于手写汉字的美化方法,其特征在于所述步骤(5)对手写汉字笔画进行渲染的步骤包括(51)、判断输入笔画的点数,如果点数少于30,判断笔画为点,用独体连接件进行渲染,结束;(52)、如果点数多于30,再判断步骤(2)中提取到的拐点数,如果拐点数为2,说明笔画只有笔画头和笔画尾两个拐点,判断该笔画为简单笔画,进行简单笔画渲染,结束;(53)、对于其他的复合笔画,进行普通的复合笔画渲染,结束。9、根据权利要求8所述的用于手写汉字的美化方法,其特征在于所述步骤(5)包括对笔画段拟合的方法,其具体步骤如下(A)、将插值处理后的点序列进行最小二乘法贝氏拟合,得到拟合后的贝氏曲线,同时得到最大拟合误差位置及误差值;若误差值大于某一阈值,则将原曲线分为两段曲线,并分别再次拟合,直到误差小于阈值。(B)、依据不同类型的笔画段,分别赋予原始曲线每个时序点不同的宽度信息,分别得到三种宽度信息;(C)、将贝氏曲线分为5段,分别为1=0,0.25,0.5,0.75,1处的5个端点,并求取这5个点处的宽度,这个宽度是距离原始曲线最近的那个点的宽度;(D)、用变宽贝氏曲线的反走样画法将含变宽信息的贝氏曲线表达出来,依据步骤(C)中赋予的宽度,在每个曲线点处用相应宽度的反走样圆进行渲染,最终得到美化后的笔画段。10、根据权利要求9所述的用于手写汉字的美化方法,其特征在于所述步骤(5)包括对连接件的渲染操作,具体如下所有的连接件均用若干段贝塞尔曲线拟合连接件的轮廓,记录其坐标点;根据实际笔画的参量,通过二维图形的平移、旋转、縮放三种基本变换方法,将其适配到目标位置,最终用泛填法填充轮廓内部,完成连接件的渲染;其中对于独体连接件,笔画的参量包括书写方向、长度、宽度;对于单向连接件,笔画的参量包括相连笔画段书写方向、相连笔画段的宽度;对于双向连接件,笔画的参量包括第一笔画段书写方向、第一笔画段宽度、第二笔画段书写方向、第二笔画段宽度。全文摘要本发明提供了一种用于手写汉字识别的笔画特征美化方法,包括如下步骤(1)对手写汉字的点序列进行插值处理,插值后的点序列为空间上连续的笔画曲线;(2)提取笔画的拐点信息,并根据拐点把笔画分段;(3)建立汉字笔画中的笔画段模型;(4)建立汉字笔画中的连接件模型;(5)根据笔画段及连接件组合规则,对手写汉字笔画时序点序列的方向信息采用步骤(3)和(4)中的笔画段和连接件模型进行渲染,从而完成对笔画的美化。文档编号G06T11/80GK101639942SQ200910042119公开日2010年2月3日申请日期2009年8月25日优先权日2009年8月25日发明者夏伟平,金连文申请人:华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1