汉字笔画造字法的制作方法

文档序号:6606013阅读:3547来源:国知局
专利名称:汉字笔画造字法的制作方法
本说明书介绍一种以“形旁和声旁组成形声字”的造字规律,运用全信息计算机汉字表达式知识库以及“递归定义算法”,在计算机一维平面上自动生成各式各样汉字字形的计算机自动造字法--同舟自动造字法。
一、文字的产生和汉字演变的简单过程文字是人们用于表达思想的一种有规律性的、系统化的符号。说话是用声音来描述这种符号,是以音达意。写字是用象形来描述这种符号,是以形达意。为了便于人们记忆这些可以表达各种不同思维活动的符号,遵循着两条不同的轨道,就形成了两大类文字系统--拼音文字系统和象形文字系统。由于拼音文字是按照发音的先后次序,在一维空间建立了一个线性序,并将各种不同频率的声音,用少量的可区别符号记录下来,便有了以形代音的拼音文字。这些记录发音的可区别符号称之为字母。如英文字母就是26个。因此,拼音文字的优点是用很少量的字母,排成一维的序,便可产生无限多个表达不同思维活动的文字。而且见形即可发音,以音达意。由于拼音文字“形音结合”的直接性,所以能做到字话一律,见字即能念,会说即能写,有多少个词就有多少个字,发展至今已有几十万个单词。
象形文字不但注重形音结合,更注意形意结合。它不但在一维空间建立了一个用音描述文字符号的序,还在二维平面建立了一个用形描述文字符号的序,不但做到见形发音,而且还可以直接见形知音。而且从形到意是有规律可循的。我国汉代著名文学家许慎在“说文解字”一书中写道“仓颉之初作书,盖依类象形,故谓之文。其后形声相益,即谓之字。字者,言孳乳而浸多也。”如许慎所言,仓颉造字是先有象形的文。文者,花纹也,与图案相似。随着天地万物本身的曲线形态来构造,在甲骨文、金文时代还无特定的结构,象什么是什么罢了。秦相李斯统一六国文字后,创造了秦篆,简化曲线图案,形成了有规律的笔画,但仍保留了象形文字的结构。而且形声相益,由象形的文孳乳繁衍出形声字。以后,由篆到隶,由隶到楷,象形的汉字结构没有变,笔画却形成了平直方正的有规律的系统,文字也就演变成为越来越利于书写的象形文字了,并长期处于“形声字”长期稳定的阶段。这就是我国汉字发展、演变的大致过程。
二、目前我国造字的现状以及计算机造字的缺陷。
现行的计算机造字方法,大都采用字型专家设计的字体和字型,通过专家把每个字画在纸上,用数字化仪或扫描仪把一个个画在纸上的字扫描输入到计算机进行数字化处理而变为点阵汉字(也称Bitmap,用无数个点来描述汉字笔划)。通过计算机软件和程序,把这些点阵汉字转变为轮廓字,用计算机软件把这些轮廓字一个个调出来,在计算机屏幕上用人工进行逐个修整,去掉多余的点,保证直线段和曲线段的平滑过渡,得到合格的、质量好的轮廓字,然后,把经过修整过的轮廓字,用程序转变为POSTSCRIPT或者TRUE TYPE数据格式的字,最后经过排序而得到字库。尽管用计算机来处理,但整个过程仍需要大量的人工干预,生成一套国标GB-2312字库字形,要花费一人一年的时间。
三、同舟造字法的原理同舟造字法遵循形声字是由“形旁”和“声旁”组成形声字的结构规律和所有汉字是由五种基本笔划(即横“一”、竖“丨”、撇“丿”、捺“”、点“丶”组成汉字的二个构字基本规律为原理,采用“递归定义算法”,借用全信息汉字表达式知识库和创建新汉字的全信息表达式知识库的形式而完成无限个汉字的造字过程,它是未来计算机造字的方向。要完成自动生成无限个汉字的造字过程,必须具备如下几个条件一是具备“以用很少量的字母,排成一维的序,便可产生无限多个表达不同思维活动的文字”这一条件。大家知道,英文字母的数量只有26个,而电脑又是在英文的条件下发明的,它之所以具有无限的扩展性,就是因为它的组字元素少,内外码相同,交换容易,输入时,不需代码,直接输入英文字母,在一维平面组合单词简单快捷。
我们在汉字中提取了52个中文字母字,具有与52个英文大小字母的组字特性和功能,并且理顺了长期以来一直被人们颠倒了的中英文字素的正确关系,即英文单词本来与中文的字词相对应,英文的字母本应是与中文的字部件或组合笔画对应关系,但长期以来却一直被中文计算机的设计者们颠倒为中文的字与英文的字母、中文的词与英文的单词等同。大量的数据表明,我们所提取的52个中文字母字(35个形旁、5种单笔划和12种复合笔划构成)完全可以组合所有的汉字,并且运用这52个中文字母可以造出无限个汉字。这52个中文字母字分别是目、人、 十、虫、讠、广、食、 月、 白、酉、山、禾、石、口、 钅、车、革、门、马、尸;日、亻、 犭、 亠 、二、冂、衤、、丶、一、丨、丿、宀、 扌、艹、 二是具备全信息汉字表达式。(详见分项发明专利“全信息汉字表达式的实现方法”)全信息汉字数学表达式如下F=∑fi{T1(a、b、c)、T2(a、b、c)……Tn(a、b、c)}i=1-∽n≤256F定义为汉字的集合,集合的数量由i定义,可以是无限的。
Tn表示中文字母字元素。n≤256表示组成汉字的中文字母字元素小于256。在实际应用中,n=52a表示中文字母字所处结点的结构信息b表示中文字母字的定位信息c表示中文字母字尺寸信息下面是52个中文字母字组成汉字的实际表达式。在得到实际表达式之前,我们定义如下参数缺省值表示中文字母字;1表示汉字的左右结构;2表示汉字的上下结构;3表示汉字的左中右结构;4表示汉字的上中下结构;5表示汉字的独体结构;6汉字的递归定义符,它表示该汉字的全信息汉字表达式采用递归调用方法;a(x,y)表示中文字母字的尺寸参数;b(x,y)表示中文字母字的位移参数;以“覆”字为代表的汉字在实际应用中的全信息汉字表达式覆=2[5一冂丿乚一1(2 亻3( 日5 按照“递归定义算法”,汉字“覆”的全信息汉字表达式就变为如下表达式覆=2[6西6復]西=5一冂丿乚一復=1[6彳6复]复=3[ 日6夂]夂=5 三是必须具有中文自身的信息交换标准代码。
由于52个中文字母的全信息汉字表达式的出现,制定一个基於中文的计算机信息交换码标准,我们称它为中文字母字信息交换码,英文缩写为CACII(Chinese Alphabet Code for Information Interchange)。一个最简单的方法是用52个中文字母字和中文标点符点,替换ASCII代码的52个大小写英文字母和英文标点符点而成为CACII代码。
四是中文字母字组字技术。(详见分项发明专利“中文字母字组字技术”申请号99114284.5)四、“同舟自动造字法”的实现借助上面四项技术,“同舟自动造字法”就变为非常简单,只要用递归算法来定义你要造的字,计算机根据递归定义和调用全息汉字表达式,就能造出你要的汉字。
下面是国标(GB-2312)16区的94个汉字的递归定义的全信息汉字表达式,计算机根据定义就可以自动造出这94个宋体汉字。 “同舟自动造字法”所造的汉字数目是无限的,所造的字体字型风格也是无限的。下面举两个例子如果我们新增加的汉字在全信息汉字表达式知识库里找不到该字的定义,可增加新的全汉信息汉字表达式给知识库。举例如下“綗”是我们需要新增加的一个左右型汉字,但在知识库里并没有右边部件字 的全汉信息汉字表达式定义,所以需要增加新的定义如下: 计算机根据这些新的定义自动生成这个字。同时也可以用所定义的 字与所有形旁组成一系列新字。
五、创造新的全信息汉字表达式知识库用传统的造字方法生产一套汉字字库是一件相当费工费时的繁重任务。一套6763个汉字字库的制作要花掉一人一年的时间。借助全信息汉字表达式和递归定义算法,仅仅只要精心制作52个中文字母字库和调整修正尺寸参数库和移位参数库,创造新的全信息汉字表达式知识库,借助这些技术,制作一套6763个汉字大概一人半个月的时间即可完成。通过改变52个中文字母字的型状和风格,很容易产生系列新字体。也可以无限扩大字数,由6763个汉字变为没有数目限制的无限汉字字符集。
我们用“全信息汉字表达式知识库”这个提法是因为计算机借助知识库的内容能够理解汉字的结构和组成,并能写出这个汉字,计算机具有写汉字造汉字的的智能。计算机全信息汉字表达式知识库应包括下面几个内容(1)汉字独体字和音旁字的全信息汉字表达式;(2)没有收入到52个中文字母字的形旁字的全信息汉字表达式;(3)部份特殊复合字的递归定义式;(4)形旁字与声旁字互相拼字的宽度表。
该同舟自动造字法将广泛用於汉字的输入、输出设备。真正做到和实现了计算机自动造汉字。大大提高汉字字库的生产效率。
说明书附面说明该图是以“递归定义算法”和“全信息汉字表达式”显示中文字母字组成汉字(以“啊”字为例)递归组字示意图。以此种方法可以造出无穷尽个汉字,与英文字母造词一样简单和容易。
权利要求
1. 不得将“同舟自动造字法”的中文字母字组字技术、形声字的形旁字、声旁字的递归定义造字原理、全信息汉字表达式知识库等技术应用于非F系统的任何品牌的计算机制作任何造字软件;
2. 不得将以上技术应用到非键盘输入设备作为汉字输入和造字软件,或制成其他输入法输入和传输文字信息等。
3. 不得以上述技术配套其它品牌的计算机冒充尖端单字节汉字电脑。
全文摘要
本造字法以形声字的造字规律,运用全信息汉字表达式知识库和递归定义算法,在计算机一维平面自动生成汉字各种字体和字型。由于采用52个字母字组拼汉字,具有英文字母组单词的无限扩充性,所造汉字内码具有唯一性,故可造出无限个不同风格的汉字,而且在F系统规范下的计算机都可以读出和打印出这些汉字。该造字法广泛应用于汉字输入、输出设备等,实现了计算机自动造字的夙愿,将大大提高汉字字库的生成技术和效率。
文档编号G06F17/00GK1294357SQ9911450
公开日2001年5月9日 申请日期1999年10月21日 优先权日1999年10月21日
发明者吴昌森, 周海筹, 唐秀昌, 郑承梁, 何庆, 张彦红 申请人:张彦红
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1