在计算机中描述汉字的网格及其描述方法

文档序号:6388392阅读:198来源:国知局
专利名称:在计算机中描述汉字的网格及其描述方法
技术领域
本发明属于计算机中文信息处理领域,具体说是涉及一种在计算机中描述汉字的网格及其描述汉字的方法。
背景技术
目前国际上采用的文字计算机信息处理以很多都是以字母为基元,组字时按一定的规则进行拼合,虽然文字不断发展,但字母长期稳定,因而可以建立长期稳定的标准,信息化开销小,效率高,便于采取纠错抗错措施而传输质量高。文字的拼合结构非常简单字母按先后次序排列,具有一维特征。
而目前国际、国内的中文信息处理系统都是采用字库方式,即先将某一标准规定的汉字建立字库,每一个汉字都有唯一的编码,这个编码是存储、传输和管理等信息处理的对象。也就是说,计算机在进行中文信息处理时是以汉字作为最小单位——基元来进行处理的。
汉字是一种拼合文字,是以偏旁部首等部件按照一定的规则拼合而成的,汉字的结构特征非常复杂,汉字的结构特征是采用部件如偏旁、或部首、或笔划按一定语义构成合体字,主要结构为上、下结构,如昌、思、恋;左、右结构,如作、相、林;上、中、下,结构如草、慧;左、中、右结构,如树、辨;
全包围结构,如因、国、围;半包围结构,如这、凶、病;品字形结构,如轰、品、晶;整体结构,如大、月、人。
其中半包围结构又可以细分为上半包围结构,如同、冈;下半包围结构,如凶、幽;左半包围结构,如匡、病;右半包围结构,如勾、匈。
汉字既是象形文字,同时又是表义文字,汉字部件组合成合体字时通过结构表现了语义。例如“思”,其意义是把“田”放在“心”上,体现中国是一个农业国,人们对于土地这一主要生产资料的珍爱。在“思”字中,两个部件“心”和“田”的长宽比发生了变化,高度都只有单体字的一半高。
这说明汉字的部件在组字时,部件的位置、形态和大小都在发生变化。这就是现有计算机中文信息系统的核心技术不采用拼合组字的方法而采用字库的原因所在。
在现有的字库中,点阵型字库的一个汉字采用16×16或24×24的点阵来表示,也是一种网格,这种网格仅仅是用来表示汉字的字形,没有组字的功能。由于汉字数量很多且不断发展,这就使得国家乃至国际组织很难为汉字制定长期稳定的标准。同时信息产业和信息化的开销大,效率低,传输中不便采用纠错措施而可能出现坏码等问题,从而影响传输质量。

发明内容
本发明的目的是克服目前中文信息处理系统采用汉字字库而存在的诸多缺点,提出一种在计算机中对汉字进行描述的简易网格及其对汉字的描述方法。
为了达到上述的发明目的,本发明采用的技术方案为本发明提出一种2×2或3×3网格对汉字的结构进行描述,2×2或3×3网格分别采用两列两行或三列三行的网格结构。网格既可以是正方形,也可以根据字体需要按比例做成长方形,每个网格的尺寸根据字号来确定。
本发明通过上述两种网格相结合来描述汉字。
由于汉字的数量很多,本发明对汉字的描述采用将两种网格结合来确定每个汉字的各个组成部件的结构信息,两种网格的结合,采用对一个汉字通过2×2和3×3网格来分别描述,也可以对整个汉字进行描述,而对该汉字里面的若干组成部件也进行描述。
上述描述方法中,对于结构比较简单的汉字,只需用一种网格就能描述清楚,例如上下结构中,上下对称的字适合用2×2网格描述,不对称的字适合用3×3网格进行描述且较小的部分在上、下一行中;上中下结构选用3×3网格进行描述;左右结构中,左右对称的字选用2×2网格描述,不对称的字适合用3×3网格进行描述且较小的部分在左、右一列中;左中右结构选用3×3网格进行描述;品字型结构的汉字选用2×2网格描述;全包围结构、半包围结构选用3×3网格进行描述;
整体结构的汉字中间部件比较简单的选用2×2网格描述,中间部件较为复杂的用3×3网格进行描述。
其描述方法如下表所示 本发明采用的网格是一种非常简易的网格,实施方便,本发明通过这种网格对汉字进行描述的方法也是简单易行,可以实现描述汉字的部件组字,进而开发出无字库的计算机中文信息系统,使中国的信息产业在国际竞争中处于与字母文字国家的信息产业相同的平台。


图1为本发明的网格结构示意图;图2为本发明用两种网格相结合对汉字进行描述的示意图;图3为本发明用两种网格套迭对汉字进行描述的示意图;
图4为本发明对汉字“笆”进行描述的示意图;图5为本发明对汉字“病”进行描述的示意图;图6为本发明对汉字“圆”进行描述的示意图;图7为本发明对汉字“幽”进行描述的示意图;图8为本发明对汉字“岛”进行描述的示意图。
具体实施例方式
本发明提出的用于在计算机里描述汉字的简易网格如附图1所示,本发明提出一种2×2或3×3网格对汉字的结构进行描述,2×2或3×3网格分别采用两列两行或三列三行的网格结构。附图1中左边为2×2网格结构,右边为3×3网格结构,网格既可以是正方形,也可以根据字体需要按比例做成长方形,每个网格的尺寸根据字号来确定。
直接采用本发明的网格对普通汉字进行描述,上下结构中,上下对称的字适合用2×2网格描述,不对称的字适合用3×3网格进行描述且较小的部分在上、下一行中;上中下结构选用3×3网格进行描述;左右结构中,左右对称的字选用2×2网格描述,不对称的字适合用3×3网格进行描述且较小的部分在左、右一列中;左中右结构选用3×3网格进行描述;品字型结构的汉字选用2×2网格描述;全包围结构、半包围结构选用3×3网格进行描述;整体结构的汉字中间部件比较简单的选用2×2网格描述,中间部件较为复杂的用3×3网格进行描述。
如附图2所示,采用本发明提供的两种网格相结合对汉字进行描述,例如“嘏”字,通过3×3网格我们知道“嘏”字为左中右结构,且三部分各占1/3宽,而通过2×2网络,我们知道了部件“古”字下面“口”字的高为1/2字高,上面的一横在上1/3处。右边部件下面的“又”也为1/2字高,上面部分占据(1,c)网格。中间部件上面的封闭部分占据(2,b)网格,下面的两横中的上面一横高度位置在字的高度中线上,而其中的下面一横通过3×3网格表明在下1/3线上。通过两个网格的配合使用,完整描述了“嘏”字的平面结构。
如附图3所示,有些汉字需采用两个网格套迭使用才能更完整描述其结构,其方法是采用一种网格对该汉字进行描述,然后再用另一种网格或相同的网格对该汉字的一个或一个以上组成部件进行描述。例如“幢”字,通过3×3网格,知道该字为左右结构,左边的部件“巾”旁占据a列,右边又是上下结构,立字在上,占据(1,b)(1,c)两个网格,下面的部件“里”占四个网格,具体通过“里”字的2×2网络和3×3网格,“田”字和“土”的结构得到完整的刻画,只是“里”字的宽和高均为字高的2/3。可见通过两个网格的套迭使用,使“幢”字得到完整的描述。
如附图4所示来描述“笆”字,由网格可见,“笆”字为上下结构,上为“竹”字头,左、右对称,各占字宽的1/2;高度为字高的1/3。下为“巴”字,宽为字宽,高度为字高的2/3。
如附图5所示来描述“病”字,由网格可见,“病”字为左半包围结构,左半包围为“病”盖,在3×3网格中占最上一行和最左一列,“丙”占据(2,2)(2,3)(3,2)(3,3)4个网格,高度和宽度均为字高、宽的2/3,可以用2×2网格来描述。
如附图6所示来描述“圆”字,由网格可见,“圆”字为全包围结构,包围“口”为字的边界,“员”由“口”字和“贝”字组成,占据(1,2)(2,2)(3,2)3个网格,高度和宽度均为字高、宽的2/3,可以用2×2网格来描述。
如附图7所示来描述“幽”字,由网格可见,“幽”字为下半包围结构,下半包围为字的左、下、右边界,包围内的两个部件宽度和高度分别由2×2和3×3网格描述。
如附图8所示来描述“岛”字,由网格可见,“岛”字为右半包围结构,右半包围鸟字旁分别由2×2和3×3网格描述,“山”由3×3网格描述。
权利要求
1.一种在计算机中描述汉字的简易网格,其特征在于所述的简易网格包括2×2或3×3的矩阵结构。
2.根据权利要求1所述的一种在计算机中描述汉字的简易网格,其特征在于所述的网格既可以是正方形,也可以根据字型需要按比例做成长方形,每个网格的尺寸根据汉字的字号来确定。
3.一种采用权利要求1所述的简易网格在计算机中描述汉字的方法,其特征在于所述的描述方法对一个汉字通过2×2和3×3网格来分别描述,或通过一种网格先对整个汉字进行描述,再通过一种网格对该汉字里面的若干组成部件进行描述。
4.根据权利要求3所述的描述方法,其特征在于所述的描述方法可以只采用一种网格对汉字进行描述。
5.根据权利要求3或4所述的描述方法,其特征在于所述的描述方法对上下结构的汉字选用2×2或3×3网格描述;对上中下结构的汉字选用3×3网格进行描述;对左右结构的汉字选用2×2或3×3网格进行描述;对左中右结构的汉字选用3×3网格进行描述;对品字型结构的汉字选用2×2网格描述;对全包围结构或半包围结构的汉字选用3×3网格进行描述;对整体结构的汉字选用2×2或3×3网格进行描述;
6.根据权利要求5所述的描述方法,其特征在于对上下结构的汉字进行描述时,组成该汉字的上下部件对称的选用2×2网格描述,不对称的选用3×3网格进行描述且较小的部件放在最上或最下一行中。
7.根据权利要求5所述的描述方法,其特征在于对左右结构的汉字进行描述时,组成该汉字的左右部件对称的选用2×2网格描述,不对称的选用3×3网格进行描述且较小的部件放在最左或最右一列中。
8.根据权利要求5所述的描述方法,其特征在于对整体结构的汉字进行描述时,该汉字的中央部件简单的选用2×2网格描述,复杂的选用3×3网格进行描述。
9.根据权利要求3所述的描述方法,其特征在于通过一种网格先对整个汉字进行描述,再通过一种网格对该汉字里面的若干组成部件进行描述是,可先采用2×2网格对整个汉字进行描述,然后再用3×3网格对该汉字的一个或一个以上组成部件进行描述,或先采用2×2网格对整个汉字进行描述,然后再用2×2网格对该汉字的一个或一个以上组成部件进行描述,或先采用3×3网格对整个汉字进行描述,然后再用2×2网格对该汉字的一个或一个以上组成部件进行描述,或先采用3×3网格对整个汉字进行描述,然后再用3×3网格对该汉字的一个或一个以上组成部件进行描述。
10.根据权利要求3或9所述的描述方法,其特征在于对组成汉字的部件也可以采用先对该部件进行描述,再对该部件里的部件描述。
全文摘要
本发明提出一种在计算机中描述汉字的简易网格及其描述方法,简易网格包括2×2或3×3的矩阵结构。采用简易网格在计算机中描述汉字时,可对一个汉字通过2×2和3×3网格来分别描述,或通过一种网格先对整个汉字进行描述,再通过一种网格对该汉字里面的若干组成部件进行描述,也可以只用一种网格进行描述。本发明简单可行,实施方便,可以实现描述汉字的部件组字,进而开发出无字库的计算机中文信息系统,具有深远的现实意义。
文档编号G06F17/20GK1558339SQ200410015239
公开日2004年12月29日 申请日期2004年1月20日 优先权日2004年1月20日
发明者皮佑国, 牟总斌 申请人:华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1