汉字书写笔画间关系规范性描述与评判方法及装置与流程

文档序号:14302787阅读:887来源:国知局
汉字书写笔画间关系规范性描述与评判方法及装置与流程

本发明涉及手写汉字规范性判定技术领域,尤其涉及对书写汉字的过程与结果进行动态评价的评判方法与装置。



背景技术:

根据汉字的书写过程和构成结构,汉字书写的评测可分为四个阶段:笔画规范性评测、笔顺规范性评测、笔画间关系规范性评判和结构规范性评测。汉字书写过程规范与否,尤其是书写错误的情况,一般要给出确定的判断。手写汉字规范性判定技术领域,比较重要的一环是笔画间关系的评判技术。结构规范性的一部分是笔画间关系的评判,即笔画与笔画之间的关系,这不仅仅限于笔画间是交叉、相接或相离(简称交接离)的关系,还要考虑判断这种交接离关系所涉及的两个笔画的位置,另外还要考虑评判的效率,降低计算难度。

现有技术只是限于评判汉字笔画间的交叉、相接还是相离的关系,并没有考虑到手写汉字笔段之间距离与位置的关系。本发明在专利公开号为CN101320422A的专利名称为《手写汉字笔画交接离的规范性判定方法和装置》的专利技术基础上,提出了一种更为简洁的笔画间关系的描述方法,定义了邻近位置的概念和描述方法,能简洁描述和评判汉字笔段或笔画间关系的规范性,包括交接离及涉及的笔画位置关系。



技术实现要素:

为克服上述问题,本发明提出了一种汉字书写笔画间关系规范性描述与评判方法及装置。

本发明中两个笔画笔段间的邻近位置是指:两个笔段中最邻近的点在两个笔段上的位置。

本发明的技术方案为:

汉字书写笔画间关系规范性描述与评判方法,其特征在于,包括:

1)获取手写汉字的笔画;

2)确定手写汉字笔画的笔段,判断笔画是否有拐点,如果是,将笔画在拐点处断开,分成多个笔段,否则,把一个笔画作为一个笔段;

3)判定手写汉字每一笔画的笔段与其它笔画的笔段间的邻近位置关系;

判定任意两笔画笔段间的邻近位置关系具体为:将笔段位置划分为三段,分为头部T、中部Z和尾部W,以两个笔段中最邻近的点在两个笔段上的位置来判断其关系;

4)获取手写汉字对应的标准汉字每一笔画的笔段与其它笔画的笔段间的邻近位置关系;

5)判定手写汉字的规范性:比较手写汉字笔段间的邻近位置关系与标准汉字笔段间的邻近位置关系,如果相同,则手写汉字笔画间关系符合书写规范;如果不相同,则手写汉字笔画间关系不规范。

进一步,在步骤2)之后还包括如下步骤:

a)获取书写错误评判规则库中与该手写汉字对应的汉字的书写错误评判规则,评判规则采用邻近位置关系规则;

b)获取与书写错误评判规则库中对应的手写汉字笔段间的邻近位置关系;

c)判断书写错误评判规则库中规定的笔段间的规则是否与手写汉字对应的笔段间的邻近位置关系相符合,如果符合,则手写汉字笔画间关系不规范,如果不符合,则执行步骤3)。

进一步,书写错误评判规则库中与该汉字的邻近位置关系规则为:设置三元组f(x,y,NonState)来表示书写错误评判规则库中该汉字的笔段间的错误邻近位置关系;

其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较的笔画的序列号,x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔画,小数部分代表该笔画中的第几笔段;NonState表示在第x笔段上与第y笔段相邻近的点位于第x笔段上的错误位置信息,NonState指定的错误位置信息分为头部T、中部Z和尾部W。

进一步,假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部T、中部Z和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z区域范围从点m至点n,尾部W区域范围从点n至笔段的结束点;假设笔段长度为1个单位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为2/3~6/7。

进一步,根据不同字体设置不同头部、中部、尾部区域范围。

汉字书写笔画间关系规范性描述与评判装置,其特征在于,包括:

1)手写汉字笔画获取单元,用于获取手写汉字的笔画;

2)笔段确定单元,用于判断笔画是否有拐点,如果笔画存在拐点,将笔画在拐点处断开,分成多个笔段,否则,把一个笔画作为一个笔段;

3)手写汉字笔段间邻近位置判定单元,用于判定手写汉字每一笔画的笔段与其它笔画的笔段的位置关系;

判定任意两笔段的邻近位置关系具体为:将笔段位置划分为三段,分为头部T、中部Z和尾部W,以两个笔段中最邻近的点在两个笔段上的位置来判断其关系;

4)标准汉字库:存储有汉字中每一笔画的笔段与其它笔画的笔段的邻近位置关系;

5)标准汉字笔段间邻近位置判定单元,用于获取手写汉字对应的标准汉字库中存储汉字的每一笔画的笔段与其它笔画的笔段的位置关系;

6)第二规范性确定单元,比较手写汉字笔段间的位置关系与标准汉字笔段间的位置关系,如果相同,则手写汉字笔画间关系符合书写规范;如果不相同,则手写汉字笔画间关系不规范。

进一步,汉字书写笔画间关系规范性描述与评判装置还包括:

a)书写错误评判规则库,规则库中已预先存储有常见的汉字书写错误的评判规则;

b)错误类型获取单元,获取书写错误评判规则库中评判规则;

c)第一规范性确定单元,用于判断书写错误评判规则库中规定的笔段间的规则是否与手写汉字对应的笔段间的邻近位置关系相符合,如果符合,则手写汉字笔段间关系不规范,如果不符合,则送至手写汉字笔段间邻近位置判定单元,用于判定手写汉字每一笔画的笔段与其它笔画的笔段的位置关系。

进一步,书写错误评判规则库中的常见错误的评判规则为:设置三元组f(x,y,NonState)来表示书写错误评判规则库中该汉字的笔段间的错误邻近位置关系;

其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较的笔画的序列号,x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔画,小数部分代表该笔画中的第几笔段;NonState表示在第x笔段上与第y笔段相邻近的点位于第x笔段上的错误位置信息,NonState指定的错误位置信息分为头部T、中部Z和尾部W。

进一步,假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部T、中部Z和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z区域范围从点m至点n,尾部W区域范围从点n至笔段的结束点;假设笔段长度为1个单位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为2/3~6/7。

进一步,根据不同字体设置不同头部、中部、尾部区域范围。

本发明的优点在于:

1.本发明可以快速评判书写汉字的正确性。本发明充分考虑手写汉字笔段之间的关系,在专利公开号为CN101320422A、CN101344918A公开的笔画间关系的技术基础上,提出了一种更为简洁的笔画间关系的描述方法,定义了邻近位置的概念和描述方法,能简洁描述和评判汉字笔段或笔画间关系的规范性,包括交接离及涉及的笔画位置关系。本发明可以将手写汉字笔段距离和位置关系与笔画间关系相结合,生成笔段间的距离位置关系,提高智能评判汉字的准确性。例如“人”和“入”之间的评判,在现有的书写汉字笔画评判技术中,这两个字的评判准确率低。当引入笔画间邻近位置关系时,将“人”和“入”的撇和捺按照手写汉字的起点分别分为头部(T)、中部(Z)、尾部(W),则确定其邻近位置的关系描述分别为ZT、TZ,提高了评判准确率。

2.本发明将每个手写汉字笔段分为三部分进行判断,方法简单,降低了评判计算难度,提高了运算效率。

3.在比较手写汉字笔段间的邻近位置关系与标准汉字笔段间的邻近位置关系前,设置了书写错误评判规则库及预先判定常见书写错误类型,大大提高了运算的效率。

附图说明

图1是汉字书写笔画间关系规范性描述与评判方法示意图;

图2是汉字书写笔画间关系规范性描述与评判装置的结构示意图;

图3是汉字“与”字书写笔画及笔段示意图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合图示与具体实施例,进一步阐述本发明。

实施例一:

如图1所示,汉字书写笔画间关系规范性描述与评判方法,包括:

步骤101.获取手写汉字的笔画;

上述获取手写汉字笔画的方法可以为使用者在触摸屏上写字,触摸屏将触摸压力转换为象素点,把该象素点作为手写汉字笔画;也可以在白纸上写字,扫描该白纸上的汉字,转化为象素点,把该象素点作为手写汉字笔画。

步骤102.确定手写汉字笔画的笔段;

判断笔画是否有拐点,如果是,将笔画在拐点处断开,分成多个笔段,否则,把一个笔画作为一个笔段;关于具体如何判断是否有拐点的方法,专利公开号为CN101320422A的发明专利对此有详细介绍。

步骤103.获取书写错误评判规则库中与该手写汉字对应的汉字的书写错误评判规则;

书写错误评判规则库中已预先存储有常见的汉字书写错误类型的评判规则;例如汉字“身”、“射”的常见错误发生在其第7笔与第6笔位置上,为此针对这两个汉字,可直接在书写错误评判规则库中规定其第7笔与第6笔的评判规则。本实施例中汉字书写错误的评判规则采用邻近位置进行判断是否书写错误。

在书写错误评判规则库中,判定任意两笔段的邻近位置关系具体为:将笔段位置划分为三段,分为头部(T)、中部(Z)和尾部(W),以两个笔段中最邻近的点在两个笔段上的位置来判断其关系;假设笔段A和笔段B为某汉字中的任一两笔段,笔段A上的点a和笔段B上的点b为最邻近的两点,在笔段A上和笔段B最为邻近的点a位于笔段A的头部,则其位置关系描述为头部(T),在笔段B上和笔段A最为邻近的点b位于笔段B的中部,则其位置关系描述为中部(Z)。

假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部T、中部Z和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z区域范围从点m至点n,尾部W区域范围从点n至笔段的结束点。假设笔段长度为1个单位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为2/3~6/7。根据不同字体可灵活设置不同的m,n参数值,以调整头部、中部、尾部区域范围。

本实施例通过提供三元组f(x,y,NonState)来表示书写错误评判规则库中该汉字的笔画的笔段与其它笔画的笔段之间邻近位置存在错误时的评判规则;其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较的笔画的序列号,State表示在第x笔段上与第y笔段邻近的点位于第x笔段上的邻近位置信息;NonState表示在第x笔段上与第y笔段邻近的点位于第x笔段上的错误邻近位置信息,NonState指定的错误位置信息分为头部(T)、中部(Z)和尾部(W)三个;x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔画,小数部分代表该笔画中的第几笔段。

以汉字“身”字为例,其第7笔段上与第6笔段最为邻近点位于第7笔段位置为中部(Z),当第7笔与第6笔最为邻近的点位于第7笔的头部时,即存在错误邻近位置关系,在书写错误评判规则库中可表示为:f(7,6,T)。

以汉字“射”字为例,在第7笔段上与第6笔段最为邻近点位于第7笔段位置为头部T;其第7笔与第6笔最为邻近的点位于第7笔的中部时,即存在错误邻近位置关系,在书写错误评判规则库中可表示为:f(7,6,Z)。

步骤104.获取与书写错误评判规则库中对应的手写汉字笔段间的邻近位置关系;

本实施例通过提供三元组(x,y,State1)来表示每个笔画与其它笔画之间的邻近位置关系;其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较的笔画的序列号,State1表示在第x笔段上与第y笔段邻近的点位于第x笔段上的位置,State1状态分为头部(T)、中部(Z)和尾部(W)三个状态。x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔画,小数部分代表该笔画中的第几笔段。

步骤105.判断书写错误评判规则库中规定的笔段间的规则是否与手写汉字对应的笔段间的邻近位置关系相符合,如果符合,则手写汉字笔画间关系不规范,如果不符合,则执行步骤106;

如果步骤103通过三元组f(x,y,NonState)来表示书写错误评判规则库中该汉字的笔段与其它笔画的笔段之间的错误邻近位置关系,那么相对应的,步骤103获取的每个笔画的笔段与其他笔画的笔段之间的关系也通过三元组(x,y,State1)来表示。比较这两个三元组,如果符合,则手写汉字笔画间关系不规范,如果不符合,则执行步骤106;

步骤106.判定手写汉字每一笔画的笔段与其它笔画的笔段的邻近位置关系;

在此处,判定任意两笔段的邻近位置关系具体为:将笔段位置划分为三段,分为头部(T)、中部(Z)和尾部(W),以两个笔段中最邻近的点在两个笔段上的位置来判断其关系;假设笔段A和笔段B为某汉字中的任一两笔段,笔段A上的点a和笔段B上的点b为最邻近的两点,在笔段A上和笔段B最为邻近的点a位于笔段A的头部,在笔段B上和笔段A最邻近的点b位于笔段B的中部,则笔段AB的距离位置关系描述为TZ;

本实施例通过提供三元组(x,y,State2)来表示每个笔画与其它笔画之间的邻近位置关系;其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较的笔画的序列号,State2表示第x笔与第y笔之间的邻近位置关系,为一两位数字;x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔画,小数部分代表该笔画中的第几笔段。

如图3所示,显示汉字“与”书写笔画及笔段,其中数字“2.1”表示第2笔画中的第一个笔段,其整数部分“2”代表第2笔画,小数部分“1”代表第2笔画竖折折钩的第一个笔段竖部分;三元组(1,2.1,TZ)表示:在第1笔段上和第2.1笔段最为邻近的点位于第1笔段的头部,在第2.1笔段上和第1笔段最为邻近的点位于第2.1笔段中部,第1笔段和第2.1笔段的邻近位置关系为TZ。

以汉字“人”为例,“人”的两个笔画就是两个笔段,在第1笔段上和第2笔段最为邻近的点位于第1笔段的中部,在第2笔段上和第1笔段最为邻近的点位于第2笔段头部,那么第1笔段和第2笔段的邻近位置关系为ZT,为此其对应的三元组为(1,2,ZT)。

以汉字“入”为例,“入”的两个笔画就是两个笔段,在第1笔段上和第2笔段最为邻近的点位于第1笔段的头部,在第2笔段上和第1笔段最为邻近的点位于第2笔段中部,那么第1笔段和第2笔段的邻近位置关系为TZ,为此其对应的三元组为(1,2,TZ)。

步骤107.获取手写汉字对应的标准汉字每一笔画的笔段与其它笔画的笔段的邻近位置关系;

标准汉字每一笔画的笔段与其它笔画的笔段的邻近位置关系可以预先判定并存储,即将全部标准汉字的每一笔画的笔段与其它笔画的笔段的邻近位置关系保存起来;在判定规范性之前,直接读取手写汉字对应的标准汉字的笔段位置关系。也可以先读取手写汉字对应的标准汉字,然后根据步骤102和步骤106的原理,判定标准汉字每一笔画的笔段与其他笔画的笔段的邻近位置关系。

步骤108.判定手写汉字笔段间的规范性。

比较手写汉字笔段间的关系与标准汉字笔段间的邻近位置关系,如果相同,则手写汉字笔段间关系书写规范;如果不相同,则手写汉字笔段间关系不规范。

如果步骤106通过三元组(x,y,State2)来表示每个笔画与其它笔画之间的关系,相对应的,步骤107获取的每个笔画与其他笔画之间的关系也通过三元组(x,y,State2)来表示。比较这两个三元组(x,y,State2),从而判定手写汉字笔段间的规范性。

本发明可用于在通过手写输入装置在线书写的情况下,实现汉字书写规范性的自动和实时评价,从而可实现汉字书写规范性考核结果的量化与考核方式及其信息的网络化,还可实现汉字规范书写的计算机实时指导。

通过比较手写汉字笔段间的位置关系与标准汉字笔段间的位置关系,判定手写汉字的书写各笔画间的位置关系是否规范,克服了人工批阅主观性的缺点,可实现汉字书写规范性的实时评价,具有评价客观全面的优点。

实施例二

请参考图2,为本发明实施例的汉字书写笔画间关系规范性描述与评判装置示意图。本实施例的汉字书写笔画间关系规范性描述与评判装置200,包括:

(1)手写汉字笔画获取单元201,用于获取手写汉字的笔画;

(2)笔段确定单元202,用于判断笔画是否有拐点,确定手写汉字笔画的笔段;如果笔画存在拐点,将笔画在拐点处断开,分成多个笔段,否则,把一个笔画作为一个笔段;

(3)书写错误评判规则库203,规则库中已预先存储有常见的汉字书写错误的评判规则;标准汉字库204,存储有汉字中每一笔画的笔段与其它笔画的笔段的邻近位置关系;

在书写错误评判规则库中,判定任意两笔段的邻近位置关系具体为:将笔段位置划分为三段,分为头部(T)、中部(Z)和尾部(W),以两个笔段中最邻近的点在两个笔段上的位置来判断其关系;假设笔段A和笔段B为某汉字中的任一两笔段,笔段A上的点a和笔段B上的点b为最邻近的两点,在笔段A上和笔段B最为邻近的点a位于笔段A的头部,则其位置关系描述为头部(T),在笔段B上和笔段A最为邻近的点b位于笔段B的中部,则其位置关系描述为中部(Z)。

假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部T、中部Z和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z区域范围从点m至点n,尾部W区域范围从点n至笔段的结束点。假设笔段长度为1个单位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为2/3~6/7。根据不同字体可灵活设置不同的m,n参数值,以调整头部、中部、尾部区域范围。

本实施例通过提供三元组f(x,y,NonState)来表示书写错误评判规则库中该汉字的笔画的笔段与其它笔画的笔段之间邻近位置存在错误时的评判规则;其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较的笔画的序列号,State表示在第x笔段上与第y笔段邻近的点位于第x笔段上的邻近位置信息;NonState表示在第x笔段上与第y笔段邻近的点位于第x笔段上的错误邻近位置信息,NonState指定的错误位置信息分为头部(T)、中部(Z)和尾部(W)三个;x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔画,小数部分代表该笔画中的第几笔段。

(4)错误类型获取单元205,用于获取书写错误评判规则库203中与手写汉字对应的汉字的书写错误评判规则;

(5)手写汉字笔段间邻近位置判定单元206,用于判定手写汉字每一笔画的笔段与其它笔画的笔段的位置关系;

判定任意两笔段的距离位置关系具体为:将笔段上的位置区分为头部(T)、中部(Z)和尾部(W),以两个笔段最邻近的两点在其笔段上的位置来表示两笔段的距离位置关系;假设笔段A上和笔段B为某汉字中的任一两笔段,在笔段A上和笔段B最邻近的点位于笔段A的头部,在笔段B上和笔段A最邻近的点位于笔段B的中部,则笔段AB的距离位置关系描述为TZ;

(6)第一规范性确定单元207、第二规范性确定单元208。

第一规范性确定单元207用于判断书写错误评判规则库中规定的笔段间书写错误评判规则是否与手写汉字对应的笔段间的邻近位置关系相符合,如果符合,则手写汉字笔段间关系不规范,如果不符合,则送至手写汉字笔段间邻近位置判定单元206,用于判定手写汉字每一笔画的笔段与其它笔画的笔段的位置关系;

第二规范性确定单元208用于比较手写汉字笔段间的位置关系与标准汉字笔段间的位置关系,如果相同,手写汉字笔段间位置关系规范,否则,手写汉字笔段间位置关系不规范。

(7)标准汉字笔段间邻近位置判定单元209,用于获取手写汉字对应的标准汉字库中存储汉字的每一笔画的笔段与其它笔画的笔段的位置关系;

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1