具有形状参数自适应的甲骨文轮廓字形自动生成方法

文档序号:6605831阅读:216来源:国知局
专利名称:具有形状参数自适应的甲骨文轮廓字形自动生成方法
技术领域
本发明涉及一种图形处理方法,具体涉及一种对甲骨文图形字形轮廓曲线的自动 生成方法。
背景技术
甲骨文是我国现存的最早成系统的文字,也是迄今发现的最古老的象形文字之 一。甲骨文产生的时期尚属于绘画阶段,所体现的语法规则是汉语语法可追溯的最早源头。 人们对于甲骨文的研究已经取得了一定的成果,文字的考释也对其意义做出了部分解释。 随着现代科技的不断发展,如何运用计算机技术将甲骨文数字化,以更好地继承这一传统 文化,在保护的基础上发展这一瑰宝,具有十分重要的历史意义与文化遗产保护价值。甲骨文作为书法,在其结构上已具有对称的、稳定的格局,在结构和笔法上已形成 一个独特的体系。对于古代汉字的处理方法,大多采用人工提取字模的方法,虽然现在用计 算机图像处理软件作为辅助技术,但是效率仍然比较低,处理时间长,容易由于人为操作不 当而引入误差,精确度也没有保障。同时,如果采用图形方式存储甲骨文,占用存储空间大, 打开图形所需时间长。在放大缩小时会产生锯齿现象。虽然,目前已有字形处理技术可用于处理现代汉字,但是由于甲骨文有着自己的 字形特点,不同于规则的现代汉字,所以甲骨文字形处理技术远比现代汉字的字形处理技 术复杂,甲骨文字形生成不能简单地套用现代汉字字形制作技术,需要更适合甲骨文的形 体特点的字形技术。否则,生成的字形会因为曲线的放大缩小而产生字形失真。

发明内容
本发明的目的是提供一种具有形状参数自适应性质的曲线拟合生成方法,以应用 于甲骨文字形曲线轮廓的生成,实现将甲骨文拓片图像转换成数学描述的轮廓曲线的形 式。为达到上述目的,本发明采用的技术方案是一种具有参数自适应的甲骨文轮廓 字形自动生成方法,包括下列步骤(1)对甲骨文拓片图像进行预处理,所述预处理包括对图像进行二值化处理、提取 字形的原始轮廓曲线;在具体实施中,上述预处理可以包括,依次对甲骨文原始图片进行去噪、图像分割 (二值化)等操作获取甲骨文文字目标;然后再进行轮廓提取与跟踪,获得轮廓点信息。(2)根据步骤(1)获得的原始轮廓曲线,提取原始轮廓曲线上的特征点,所述特征 点包括角点和分段点;所述角点的提取方法为,计算每个点与它前继间隔k个点的点之间 的连线和该点与后续间隔k个点的点之间的连线所形成的夹角,这个夹角的角度记为此点 的夹角值,从轮廓曲线起点S开始依次搜索直到夹角值大于预定义的阈值的点A,在轮廓段 SA内找到夹角值最小的点B,标识B为角点,以该角点B为起点重复上述过程以标识下一个 角点,直到遍历所有轮廓点;轮廓曲线的起点和终点为分段点;根据实验结果,k的取值为
10,夹角的阈值为160°。这些特征点实际上就是字形轮廓原始信息,不同的是这些特征点能够代表甲骨文 字形的特征,通过一定的技术能够将甲骨文字形再表达出来。(3)用三次B样条曲线拟合轮廓曲线,根据步骤⑵获得的特征点信息反求三次B 样条曲线的控制点;(4)利用最小二乘法求解与原始轮廓曲线的对应离散点距离总偏差最小的三次B 样条基函数的形状参数值;(5)根据步骤(3)获得的控制点和步骤⑷获得的形状参数值进行三次B样条曲 线拟合,获得所需的甲骨文字形轮廓曲线。上述技术方案中,所述步骤(3)中,首先根据三次B样条曲线的特征构造出通过特 征点的三次B样条曲线段的方程组(1), 方程组(1)中,QiG = 1,2-,η)为原始轮廓曲线上的特征点,Pi (i = 0,1,......,
η,η+1)为三次B样条曲线的控制点,代入特征点的数值求出控制点的值。所述步骤(4)中,形状参数值的获取过程为 式(2)中,Φ (Xi)为拟合曲线段与离散点序列dk之间的距离平方和,m离散点的 个数,tk(k= 1,2,3···πι)为步长,这里采用平均累加弦长来估算参数tk,tke W,l],初始tQ =0、tm = 1、tk+1-tk = c, c 为常数;公式(3)为式(2)中带参数λ i的三次B样条的基函数bj (t) (0 = |(1-聯-,)2 假设带局部形状参数的三次B样条曲线段的四个控制点分别为Pi_i、Pi、pi+1、pi+2, 用这四个控制点来拟合特征点Q” Qi+1之间的曲线,且两个特征点之间曲线上的数据点为 dk(k = 1,2,3—m)。
利用最小二乘法列出方程式辦Λ ) = ΣI Σ P^HbJ扎)—《I2,然后求出局部形
状参数Xi的值,其中tk(k= 1,2,3-m)为步长,这里采用平均累加弦长来估算参数tk,
δφ Λ
tke
,初始t。= 0、tm= i、tk+1-tk = c(c为常数)。根据;^ = O,这里强制定义除数
为0的方程结果为0,即可得到比较合适的Xitj这样便得到了使拟合曲线轮廓具有最小误 差的形状参数值,这也是一个自动求解形状参数,使参数达到自适应的过程。所述步骤(5)为,根据B样条曲线的拟合公式⑷, 式中,13(λ” t)为带形状参数Ai的分段三次B样条曲线,结合上述步骤中获 得的控制点信息和自适应形状参数值进行三次B样条曲线拟合,生成甲骨文字形的轮廓曲 线。由于上述技术方案运用,本发明与现有技术相比具有下列优点1.本发明通过对甲骨文图形的特征点提取,利用三次B样条曲线拟合,实现了甲 骨文字形的自动生成,解决了人工提取甲骨文字模过程消耗大量劳动力和时间,以及人为 因素影响的精度不高的问题。2.利用本发明获得的甲骨文字形轮廓曲线,在保存甲骨文的过程中大大降低了存 储所占用的空间,加快了字形文件的读取速度。3.将本方法应用于甲骨文字形的生成,更有利于减少曲线因放大缩小而产生的字 形失真。


图1是本发明实施例一的方法流程图;图2是实施例一中甲骨文原文字图;图3是对图2进行预处理后的示意图;图4是实施例一中“龙”字的二值化后的示意图;图4是实施例一中“龙”字的原始轮廓曲线示意图;图5是实施例一中“龙”字的特征点提取后的示意图;图6是实施例一中,曲线轮廓上的特征点示意图;图7是实施例一中过原曲线上的特征点的三次B样条拟合曲线的控制点示意图;图8是实施例一中甲骨文曲线轮廓拟合结果示意图。
具体实施例方式下面结合附图及实施例对本发明作进一步描述实施例一首先对甲骨文原始拓片图片进行去噪、图像分割、平滑等图像预处理操 作处理甲骨文图像,获取甲骨文文字的二值图像;然后再进行轮廓提取与跟踪,获得轮廓点 离散数据;最后通过设定的判定规则来选取曲线拟合过程中所需要的特征点信息,这些特 征点反映了甲骨文字轮廓曲线的特征,用于曲线拟合的初始分段。整个方法主要可以分为
6以下几个步骤,流程图如图1所示。1.图像分割采用基于迭代阈值法的图像分割方法。并根据自适应产生的阈值来进行二值化, 即将分割出来的文字目标转化为像素值为0或255,其中0表示的黑点构成甲骨文字目标, 255表示的白点构成背景。通过图像分割及二值化后,甲骨文文字图像有效地去除了噪声 点,是后续处理中不可缺少的步骤之一。迭代阈值法是通过迭代的方法,自适应地选择最佳阈值。具体算法步骤描述如 下(1)求出图像中最大和最小灰度值的平均值作为阈值的初值Ttl,Ttl将图像分为背 景和目标两大区域。(2)根据1\将图像分为背景和目标的两大区域,分别对两部分求出平均灰度值,根 据两个平均灰度值再次求平均值作为新的阈值Ti+1,具体实现见下式 公式(5)中L作为灰度级数,hk是灰度值为k的像素点个数。(3)如果Ti+1 = Ti,则迭代结束,否则i — i+Ι,转到第(2)步继续迭代,求取最佳 阈值。迭代阈值法优点是在阈值的不断迭代求取过程中不仅考虑了像素点的灰度信息, 而且根据阈值将图像分为背景和目标两区域,这样将图像区域灰度特征间接的包括进来以 求取最佳分割效果的阈值。图像分割结果如图3所示。对“龙”字进行二值化处理后的结果如图4所示。2.提取轮廓轮廓提取主要是获取甲骨文字形曲线轮廓线上的离散点依次扫描图像的像素 点,如果像素点的值为0,且它的8个相邻点都是0,则将该点的值改成255 ;否则保留该点 的像素值。继续检索,直到检索完所有的文字目标区域。最后剩下的像素点值为0的点即 为轮廓线上的点。轮廓跟踪主要是为了获得经过轮廓提取后的轮廓数据并序列化。依次扫描甲骨文 轮廓提取后的像素点,标记第一个像素值为0的点为Ptl,如果Ptl的标志已经为真则停止搜 索,否则设置此点的标志为真。然后找到Ptl相邻的黑点,记为P1并设置其标记为真,从该点 出发继续搜索,直到最后搜索的点Pn+1等于Ptl为止,那么{Ρο,Ρ:,^,-PnI就是一条封闭轮 廓线。然后再把搜索起始点移到别处,继续进行下一个字形图形区域轮廓的搜索,直到所有 的轮廓点都被记录下来为止。图5展示的是轮廓提取跟踪的结果,即获得的原始轮廓曲线。3.曲线轮廓特征提取曲线轮廓特征主要是由轮廓上的特征点表现出来,如图6所示。这里的特征点包 括角点和分段点。根据甲骨文的本身字形特点,本方法采用夹角计算的方法,即计算每个点 和它前继间隔k个点的点和后续间隔k个点的点所组成的夹角,这个夹角的角度记为此点的夹角值。从轮廓线起点S开始直到一点A,A的夹角值大于预定义的阈值,然后在轮廓段 SA内找到夹角值最小的点B即局部最小值,那么就标识B为角点,这样从起点到B就是一个 划分好的轮廓段。以B为起点出发继续探测,直到遍历所有轮廓点。轮廓的起点和终点记 为轮廓的分段点。4.带自适应参数的B样条曲线拟合方法该方法根据带局部形状参数三次B样条曲线的性质,首先反求出过特征点的三次 均勻B样条曲线的控制点,然后利用最小二乘法求解与离散点距离总偏差最小的局部形状 参数,最后根据所求的控制点和形状参数进行三次B样条曲线拟合,从而生成甲骨文字形 曲线轮廓。该算法过程中形状参数是通过检测三次B样条曲线拟合结果得到的,这个过程是 自动检测匹配的过程,因此这个形状参数是自适应的形状参数,并且得到很好的曲线拟合 效果。带形状参数的三次均勻B样条对于t e
,定义下式为带参数λ i的三次B样条的调配函数
如(0 = 知 Xi-O2 6
6(0 二去[4-(7-七>2+(4-;1,)3]
O
b2(t) = -[1 + (2 + Xi)t + (5 — 2λι) 2 — (4 一 A,·)/3] 6
6 设给定一个η+1个控制点Pi (i = 0,1,......,η),也称之为特征多边形的顶点,
带形状参数的三次B样条曲线的表达式是
η-2 3 Q,3(Λ·,0= Σ Σ Pi+j-Φj(t)
ζ=1 y'=0
(4)公式(4)中bi(t)即为带形状参数三次均勻B样条的调配函数,t为步长,Cii3Ui, t)为带形状参数Xi的分段三次B样条曲线。反求三次B样条曲线控制点已知曲线上的一组特征点Qi (i = 1,2-, n),要找一条三次B样条曲线Ci,3(t)过 特征点QiG = 1,2…,n),即找一组与特征点对应的B样条控制多边形顶点Pi(i =0,1,… η+1),这就是所谓的反求三次B样条曲线控制点问题。对于三次B样条曲线,其上的型值点和控制点的位置矢量之间的关系 1,….
Cij3(O) = (p,+Pin)/6 = Qi, i = 1,2,3, ...,n_l,n 当Ptl = pn、pn+1 = P1时,三次B样条的拟合曲线是封闭的,则由控制点Pi (i = 0, ,η, η+1)拟合生成的三次B样条封闭曲线的线性方程组为 计算可得出过原曲线上的特征点Qi (i = 1,2-,η)的三次B样条拟合曲线的控制 = 0,1,......,n,n+l),如图 7 所示。在曲线拟合过程中往往会产生一些偏差,而曲线拟合的逼近程度与偏差密切联 系。衡量逼近程度最常用的一种方法是取逼近曲线C(tk)和原曲线上的数据点dk间的偏差 平方和,即总偏差表示为 最小二乘法就是要获得使总偏差Φ达到极小值时的函数,作为最佳逼近函数。这里将带形状参数的三次均勻B样条拟合曲线段代入到最小二乘法的公式中,通 式中tk(k= 1,2,3-m)为步长,这里采用平均累加弦长来估算参数tk,tk e
,初始t。= 0、tm = 1、tk+1-tk = C (c为常数),这里强制定义* = 0。甲骨文字形具体生成过程 将带自适应形状参数的三次B样条曲线拟合方法应用于甲骨文字形曲线轮廓的 生成,其过程如下ALl.提取甲骨文原曲线轮廓上的特征点Qi的集合。AL2.根据三次均勻B样条曲线的性质,将特征点信息代入公式(2),反求过特征点 的三次B样曲线的控制Api的集合。AL3.设定形状参数Ai*未知数,利用最小二乘法求解三次B样条曲线段的各个参数。AL4.将形状参数λ i和控制点信息代入公式(4),拟合生成甲骨文字形曲线轮廓 段。AL5.如果甲骨文字形原始曲线轮廓线段全部拟合完成,则结束,否则转到ALl继 续拟合生成其它曲线轮廓段。甲骨文曲线轮廓拟合结果参见附图8所示。保存甲骨文字形的特征点、轮廓点等信息到文本文件,以便下次不用进行上述图 像处理操作,通过这些文本文件中的信息直接生成甲骨文字形。用本发明生成的甲骨文字形存储空间占用少,打开速度快。如附图4占用的存储 空间为179KB,而附图5的轮廓点信息占用的存储空间为34KB,附图6的控制点所占用的存 储空间更少,仅为8KB。
权利要求
一种具有形状参数自适应的甲骨文轮廓字形自动生成方法,其特征在于,包括下列步骤(1)对甲骨文拓片图像进行预处理,所述预处理包括对图像进行二值化处理、提取字形的原始轮廓曲线;(2)根据步骤(1)获得的原始轮廓曲线,提取原始轮廓曲线上的特征点,所述特征点包括角点和分段点;所述角点的提取方法为,计算每个点与它前继间隔k个点的点之间的连线和该点与后续间隔k个点的点之间的连线所形成的夹角,这个夹角的角度记为此点的夹角值,从轮廓曲线起点S开始依次搜索直到夹角值大于预定义的阈值的点A,在轮廓段SA内找到夹角值最小的点B,标识B为角点,以该角点B为起点重复上述过程以标识下一个角点,直到遍历所有轮廓点;轮廓曲线的起点和终点为分段点;其中,k取值为10,夹角的阈值为160°。(3)用三次B样条曲线拟合轮廓曲线,根据步骤(2)获得的特征点信息反求三次B样条曲线的控制点;(4)利用最小二乘法求解与原始轮廓曲线的对应离散点距离总偏差最小的三次B样条基函数的形状参数值;(5)根据步骤(3)获得的控制点和步骤(4)获得的形状参数值进行三次B样条曲线拟合,获得所需的甲骨文字形轮廓曲线。
2.根据权利要求1所述的具有形状参数自适应的甲骨文轮廓字形自动生成方法,其特 征在于所述步骤(3)中,首先根据三次B样条曲线的特征构造出通过特征点的三次B样条 曲线段的方程组(1), 方程组⑴中,QiG = 1,2-,η)为原始轮廓曲线上的特征点,Pi(i =0,1,......,η,η+1)为三次B样条曲线的控制点,代入特征点的数值求出控制点的值。
3.根据权利要求1所述的具有形状参数自适应的甲骨文轮廓字形自动生成方法,其特 征在于所述步骤(4)中,形状参数值λ i的获取过程为 式⑵中,Φ (λ)为拟合曲线段与离散点序列dk之间的距离平方和,m离散点的个数, tk(k = 1,2,3-m)为步长,这里采用平均累加弦长来估算参数tk,tk e
,初始、=0、 tm = 1、tk+1-tk = c, c 为常数;公式(3)为式(2)中带形状参数Ai的三次B样条的基函数…⑴ 根据If = 0,这里强制定义& = 求解形状参数Ai,即得到形状参数Xi的值。
4.根据权利要求1所述的具有形状参数自适应的甲骨文轮廓字形自动生成方法,其特 征在于所述步骤(5)为,根据B样条曲线的拟合公式(4), 式中,CuUi, t)为带形状参数Xi的分段三次B样条曲线,结合上述步骤中获得的控 制点信息和自适应形状参数值进行三次B样条曲线拟合,生成甲骨文字形的轮廓曲线。
全文摘要
本发明公开了一种具有参数自适应的甲骨文轮廓字形自动生成方法,包括下列步骤对甲骨文拓片图像进行预处理;提取原始轮廓曲线上的特征点,所述特征点包括角点和分段点;用三次B样条曲线拟合轮廓曲线,根据特征点信息反求三次B样条曲线的控制点;利用最小二乘法求解与原始轮廓曲线的对应离散点距离总偏差最小的三次B样条基函数的形状参数值;根据控制点和形状参数值进行三次B样条曲线拟合,获得所需的甲骨文字形轮廓曲线。本发明方法生成的甲骨文字形轮廓曲线具有存储量小,失真率低,精度高的特点,并且大大减少了人工干预的过程。
文档编号G06K9/36GK101894370SQ201010225730
公开日2010年11月24日 申请日期2010年7月14日 优先权日2010年7月14日
发明者徐云龙, 王晓丽, 邓伟, 马小虎 申请人:苏州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1