一种字素字部文字排序法的制作方法

文档序号:6603811阅读:1145来源:国知局
专利名称:一种字素字部文字排序法的制作方法
本方法的名称是一种字素字部文字排序法(简称字部排序法)。
本方法的所属领域是文字排序、文字编码。
常用的文字排序法有笔画排序法、部首排序法、语音排序法。由于这些排序法的排序规则大多没有明文规定,可操作性差,所以有改进的必要。
本方法的目的是确立一种规范性的文字排序法和用于文字编码的规范性的文字字形数据表。
文字是由字格中的字素和其它字形特征构成的。字格是字形所占的方形平面。它有上、下、左、右四个基本方位。字素是构成字形的最小单位。字素有一(横)、丨(竖)、/(撇)、\(捺)、︵(上弧)、︶(下弧)、((左弧)、)(右弧)共八种。笔画勾中的笔锋除去“于”之外,起修饰作用,不是区别特征,故不是字素。字素本身分为头部、中部、尾部。一、头部在左、尾部在右;丨、头部在上、尾部在下;/、头部在右上、尾部在左下;\、头部在左上、尾部在右下;︵、头部在左、尾部在右;︶、头部在左、尾部在右;(、头部在上、尾部在下;)、头部在上、尾部在下。距字素头部和字素尾部的距离相等的点是字素中点。由两个以上字素组成的字是多字素字。多字素字就存在字素之间的关系。相邻的两个字素之间有空隙的是相离关系,这两个字素互为相离字素(用“离”表示)。除丨的尾部与一的头部之间无空隙并且此一的尾部又与另一个丨的尾部之间无空隙时,丨与一为相接关系之外,一个字素尾部与另一个字素头部之间无空隙的是相连关系,这两个字素互为相连字素(用“连”表示)。一个字素中部与另一个字素中部之间无空隙的是相交关系,这两个字素互为相交字素(用“交”表示)。一个字素头部与另一个字素头部之间无空隙的是相接关系,这两个字素互为相接字素(用“接”表示)。一个字素尾部(或中部)与另一个字素中部(或头部)之间无空隙的是相切关系,这两个字素互为相切字素(用“切”表示)。一组字素中的字素之间有相连、相交、相接、相切关系或通过其它字素有连络的是连属关系,这组字素为连属字素。一个字素与其它字素之间没有连属关系,则这个字素为孤立字素。字形中有区别特征的字素长短分为长(用“长”表示)、中(用“中”表示)、短(用“短”表示)三种。字部是构成文字的基本单位。只有一个字部的字是独体字(用“独”表示)、有两个以上字部的字是合体字。合体字中两个字部间有左右(用“左”表示)、上下(用“上”表示)、包围(用“包”表示)三种关系。
字部排序法排序规则规则1排序原则以字素字部、字素关系、字素长短、字部状况为前后次序排列。
规则2确定字素的规则把笔画对照字素的形状进行分解,即可得到这个字的字素。除去“冖、饣、宀、虍、疋、欠”类的横勾中的勾,“以、比、于”类的竖勾中勾是字素之外;其它笔画中的勾都不是字素。
规则3字素的排序原则这个字素中点到另一个字素中点的最短距离的字素是这个字素的后继字素;距离相等时,以较左的字素排列在前。连属字素以字素关系的相连、相离、相交、相接、相切关系的前后次序排列。孤立字素以字素中点在字格中较上的字素排列在前;字素中点在同一条水平线上的以字素头部较左的字素排列在前。一个连属字素和另一个连属字素以连属字素的中点在字格中较左、较上的连属字素排列在前。
规则4同位字素的排序规则同位字素以一、丨、/、\、︵(上弧)、︶(下弧)、(、)为前后次序排列。
规则5相离字素的排序规则相离字素以字素中点在字格中较上的字素排列在前;字素中点在同一条水平线上的以字素头部的较左的字素排列在前。
规则6相连字素的排序规则相连字素以字素中点在字格中较上的字素排列在前,并且相连字素连续排列。
规则7相接字素的排序规则除去一与丨、/相接并且一又与其它字素相连时,相连部分的最后一个字素尾部比丨、/的字素尾部较上时,一排列在前的之外;其它以字素中点在字格中较上的字素排列在前;字素中点在同一条水平线上的以字素头部的较左的字素排列在前。
规则8相切字素的排序规则除去丨与一相切并且丨的尾部连着其它字素时,一排列在前的之外;以字素中点在字格中较上的字素排列在前,字素中点在同一条水平线上的以字素头部较左的字素排列在前。
规则9相交字素的排序规则除去一与/相交并且一的尾部连着两个字素时,/排列在前的之外;以一、丨、/、\为前后次序排列。
规则10确定字部的规则由没有连属字素隔开的两个以上的依次的孤立字素组成一个字部;由连属字素和一个孤立字素组成一个字部;由连属字素和被连属字素隔开的两个依次的孤立字素组成一个字部;由连属字素组成一个字部;一个孤立字素与哪个连属字素组成的字部的形状较方正,则这个孤立字素与哪个连属字素组成一个字部。
规则11字部的排序原则字部所占字格较上、较左的字部排列在前。
规则12字素关系的排序规则具有区别特征的字素关系以相连、相离、相交、相接、相切的前后次序排列。只取第一和第二字素关系、倒数第一和第二字素关系。
规则13字素长短的排序规则具有区别特征的字素长短以长、中、短的前后次序排列。只取一次。
规则14字部状况的排序规则具有区别特征的字部状况以左右、上下、包围关系的前后次序排列;或以独体、左右、上下、包围关系的前后次序排列。
规则15调整规则用以上规则不能排列次序的,再以字素关系、字素长短排列;还不能排列次序的,进行人工调整。
规则16其它特征排序规则结合语音排序法组成语音加字部排序法或字部加语音排序法。
例如(字素关系用系表示,字素长短用短表示,字部状况用部表示)表1 GB2312-80字符集字形数据排序表举例
方法的作用是用于各种各样的文字排序、文字检素、文字编码场合。
权利要求
1.一种把文字分解成字素、确定字部的文字排序法,其特征是十六条排序规则以及应用排序规则产生的文字排序表、字形排序数据表,十六条排序规则有,排序原则、确定字素的规则、字素的排序原则、同位字素的排序规则、相离字素的排序规则、相连字素的排序规则、相接字素的排序规则、相切字素的排序规则、相交字素的排序规则、确定字部的规则、字部的排序原则、字素关系的排序规则、字素长短的排序规则、字部状况的排序规则、调整规则、其它特征排序规则。
2.根据权利要求1所述,以字素字部、字素关系、字素长短、字部状况为前后次序排列。
3.根据权利要求1所述,把笔画对照字素的形状进行分解,即可得到这个字的字素。除去“冖、饣、宀、虍、疋、欠”类的横勾中的勾,“以、比、于”类的竖勾中勾是字素之外;其它笔画中的勾都不是字素。
4.根据权利要求1所述,这个字素中点到另一个字素中点的最短距离的字素是这个字素的后继字素;距离相等时,以较左的字素排列在前。连属字素以字素关系的相连、相离、相交、相接、相切关系的前后次序排列。孤立字素以字素中点在字格中较上的字素排列在前,字素中点在同一条水平线上的以字素头部的较左的字素排列在前。一组连属字素和另一个组属字素以连属字素的中点在字格中较左、较上的连属字素排列在前。
5.根据权利要求1所述,同位字素以一、丨、/、\、︵(上弧)、︶(下弧)、((左弧)、)(右弧)为前后次序排列。
6.根据权利要求1所述,相离字素以字素中点在字格中较上的字素排列在前;字素中点在同一条水平线上的以字素头部的较左的字素排列在前。
7.根据权利要求1所述,相连字素以字素中点在字格中较上的字素排列在前,并且相连字素连续排列。
8.根据权利要求1所述,除去一与丨、/相接并且一又与其它字素相连时,相连部分的最后一个字素尾部比丨、/的字素尾部较上时,一排列在前的之外;其它以字素中点在字格中较上的字素排列在前;字素中点在同一条水平线上的以字素头部的较左的字素排列在前。
9.根据权利要求1所述,除去丨与一相切并且丨的尾部连着其它字素时,一排列在前的之外;以字素中点在字格中较上的字素排列在前,字素中点在同一条水平线上的以字素头部较左的字素排列在前。
10.根据权利要求1所述,除去一与/相交并且一的尾部连着两个字素时,/排列在前的之外;以一、丨、/、\为前后次序排列。
11.根据权利要求1所述,由没有连属字素隔开的两个以上的依次的孤立字素组成一个字部;由连属字素和一个孤立字素组成一个字部;由连属字素和被连属字素隔开的两个依次的孤立字素组成一个字部;由连属字素组成一个字部;一个孤立字素与哪个连属字素组成的字部的形状较方正,则这个孤立字素与哪个连属字素组成一个字部。
12.根据权利要求1所述,字部所占字格较上、较左的字部排列在前。
13.根据权利要求1所述,具有区别特征的字素关系以相连、相离、相交、相接、相切的前后次序排列。只取第一和第二字素关系、倒数第一和第二字素关系。
14.根据权利要求1所述,具有区别特征的字素长短以长、中、短的前后次序排列。只取一次。
15.根据权利要求1所述,具有区别特征的字部状况以左右、上下、包围关系的前后次序排列;或以独体、左右、上下、包围关系的前后次序排列。
16.根据权利要求1所述,用以上规则不能排列次序的,再以字素关系、字素长短排列;还不能排列次序的,进行人工调整。
17.根据权利要求1所述,结合语音排序法组成语音加字部排序法或字部加语音排序法。
18.根据权利要求1所述,应用排序规则产生的文字排序表、字形排序数据表。
全文摘要
文字是由字素一、丨、丿文档编号G06F17/20GK1188940SQ9711598
公开日1998年7月29日 申请日期1997年10月29日 优先权日1997年10月29日
发明者韩建堂 申请人:韩建堂
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1