字母汉字输入法的制作方法

文档序号:6586021阅读:493来源:国知局
专利名称:字母汉字输入法的制作方法
技术领域
本发明涉及的是一种计算机汉字输入法,具体地讲,本发明涉及的是一种将汉字字母化并使其适合于计算机应用的字母汉字输入法。
再来看一下我们的汉字,许慎在说文解字里把汉字的造字方法归纳为六种一、指事,二、象形,三、形声,四、会意,五、转注,六、假借,据统计,现代汉字中形声字占的比重最大,在百分之八十以上,其余五种仅占百分之十左右,也就是说形声字是汉字的主要组成部分,它的特点就基本上代表着汉字的主要特征。
所谓形声字就是一半表形、一半表声的汉字,形就是这个字所指的事物的大体样子或意思,声则是这个字的读音,比如;“鲤鱼”的“鲤”字,其中“鱼”是它的形,表示它是一种鱼类,“里”则是它的声,表示“鲤”的发音为“li”,如果我们对形声字的造字原理换一种方式表示,即直接用音节来表示它的形与声会有什么效果呢?这样“鲤”便表示为鱼(yu)+里(li)=yuli的样子,假设我们把这四个字母看成一个字,也是未尝不可的,由于我们的目的是把汉字转化成一种表音的文字,所以为了读音上的方便,我们把“形”放在声的后面,另外“形”是作为汉字所指事物的大体形状或意思而存在的,实际上没有标有读音的必要,只要我们比较一下“鲤”、“狸”、“理”三字,就会发现三个同音的形声字,之所以音同字不同,乃是因其“形”不同的缘故,由此可见”形”客观上起的作用实际上就是区别,同音不同义的汉字间的符号而已,同时也为了字母汉字的字体不致太过臃肿,本发明的研究人员把表形部分音节的韵母省略,即“鲤”表示为“liy”,按此造字原理得出的汉字字母化办法就可表示成这样一个公式形声字=“声”的注音十“形”的注音声母=字母汉字由形声字的原理可知,公式中的“声”的注音实际上就是形声字的注音,而所有的汉字都是有注音的,所以我们不用担心出现没有没“声”的汉字,倒是“形”有些麻烦,咋看之下似乎形声字才有,但是我们已把“形”推广演绎为区别同音不同义的汉字间的符号(以下我们便把“形”称作形符)。
其次,再将汉字进一步分解便会发现,所有的汉字都是由笔划组成的,只要我们给汉字笔划进行字母定义,不是形声字要找一个独善其身的符号,也是不难的,就此而言这个公式完全可以推行到所有汉字中去,则该公式便可表示为方块汉字=注音十形符=字母汉字现在的普通话基本上代表着北方的语音体系,但我国地域辽阔,各地的普通话有相当的出入,其中有两方面表现的较为普遍一是声调掌握不准、二是卷舌音和平舌音分不清楚。
在本发明的字母汉字中暂不设置声调与平、卷舌音的标法,虽然这样可能导致发音不准确,但是由于采用了形符确定一个字形,所以这方面的缺憾是可以弥补的,因此,这样也有利于推广。
另外,现有“汉语拼音方案”是繁琐的,比如“晃”注音的“huang”字母有五个之多,若要对其实行字母化则需再加上形符,那么它的字母汉字便会达到六个甚至更多,这样就增加了书写负担。
因此,在易于接受和掌握的前提下,对汉语拼音方案做一下改动也是有必要的。至于形符,在输入汉字的过程中实际上是决定输入效率的一个重要因素,由于汉字的同音字太多,有时一个形符不能确定一个汉字,而用两个形符是基本可以的,所以为了避免出现太多的音同形同字,我们以两个形符为输入的标准,当然有些字是一个形符甚至不用形符也能确定,两个形符对它们来讲是形同蛇足的,像这类情况在我们输字时认识到后,只要把不必要的形符舍去,便是其字母化后的真身了。
为实现上述目的,本发明采取的技术方案如下一种汉字字母化并使其适合于计算机应用的字母汉字输入法,其特征在于所述的汉字字母化按照如下规则形声字=“声”的注音十“形”的注音声母=字母汉字;或者,方块汉字=注音十形符=字母汉字。
(一)注音规则(1)、以字母“v”代替声母“n”;(2)、声母“zh”“ch”“sh”一律去掉”h”,直接写作“z”“c”“s”;(3)、将韵母“ang、eng、ong、ing”改成以其首字母双写的形式代替其本身;(4)、韵母 的表示方法包括(5)、当 单独处于声母“n”“l”之后时,其以双写的“u”表示;(6)、当 与“n”、“l”搭配时 上的两点省略表示为“ue”;(7)、除上面A、B两种情况外 的表示方法都同于原汉语拼音方案。
对按照上述1、2两条内容改后仍超过两个字母的韵母做精简处理(8)、将韵母“ian、iaa(iang)、ioo(iong)”中的“i”换做“n”然后再取其改后首尾字母代替其本身;(9)、将韵母“uan 、uai、uaa(uang)”中的字母“u或 换做“o”然后再取其首尾字母代替其本身;(10)、“er”改做“ea”即er=ea;(11)、“uo”直接以“o”表示,即uo=o;(12)、a、e两字母单独做注音,后面须坠以字母“u”做定音符即;(13)、o、ac、ai、an、aa(ang)、ei、en、ee(eng),ou九个韵母单独做注音时后面须坠以“e”做定音符;(14)、ea(er)不需加定音符;(15)、所涉及的二十六个拉丁字母中的a、o、e、i、u、n”六个为韵母专用字母,其余的二十个则是声母专用字母。
(二)形符规则1、汉字笔化的字母定义所述的笔划分为八种,一般的以笔划俗名注音的声母做它们的定义字母“横”的注音为“hee(heng)”则字母定义为“h”;“竖”的注音为“su(shu)”则字母定义为“s”;“撇”的注音为“pie”则字母定义为“p”;“捺”的注音为“va(na)”则字母定义为“v”;“点”的注音为“dn(dian)”则字母定义为“d”;“提”的注音为“ti”则字母定义为“t”;“钩”的注音为“gou”则字母定义为“g”;“弯”的注音为“wan”则字母定义为“w”;
2、部首(形符的又一称谓)A汉字变形类这类部首一般是可单独使用的汉字的变形体。对于它们,我们一律视其同等于原汉字,字母定义即取原汉字的声母。
B、俗称类这类非字型的部首一般有较广泛的称呼,它们的字母定义为其称呼首字的声母;C、纯笔化类这类非字型部首一般指既无字样,又没有广泛称呼的一类,它们的字母定义,以其首笔划定义字母为准;3、汉字笔划间的关系包括相离、相连、相交;4、无部首字与有部首字,将不可分的汉字称做无部首字,将可分的汉字称做有部首字,并把有部首字归纳为上下、左右、内外三种结构;5、无部首字形符的确定对无部首字的两个输字形符,我们采用砍头、去尾、首末笔法三步确定;6、有部首字形符的确定,将可以二分的汉字称做有部首字。
一、注音规则(对汉字拼音方案的改动)在对汉语拼音方案改动以前,让我们先来看一下“她”、“弹”二字按照字母化公式得出的结果方块汉字=注音十形符 =字母汉字她=ta+n(“女”字的注者声母) =tan弹=tan+g(“弓”字的注音声母)=tang显然以上二字字母化后,会很容易让我们误以为是“探”、“汤”二字没有声调的注音,这种由巧合而造成的歧读现象,说到底是因为汉语拼音方案中,声母字母与韵母字母之间没有严格分别的结果,即由于“n”、“g”二字母不但做声母使用,而且也客窜着韵母的角色,当然这是站在我们字母化的立场上,但这种语音混淆难分的情况,是绝对不利与字母汉字的形成的,所以对汉语拼音方案的改动便由此而始。
1、规范声母用字母与韵母用字母A,以字母“v”代替声母“n”即“难”字注音需写作“van”B,声母“zh”“ch”“sh”一律去掉”h”,直接写作“z”“c”“s”C、将韵母“ang、eng、ong、ing”改成以其首字母双写的形式代替其本身,
即ang=aa eng=ee ong=oo ing=ii2、韵母 的表示方法A当 单独处于声母“n”“l”之后时,其以双写的“u”表示,即 =nuu =luuB、当 与“n”、“l”搭配时 上的两点省略表示为“ue”即 =nue =lueC、除上面A、B两种情况外 的表示方法都同于原汉语拼音方案。
3、对按照上述1、2两条内容改后仍超过两个字母的韵母做精简处理A、将韵母“ian、iaa(iang)、ioo(iong)”中的“i”换做“n”然后再取其改后首尾字母代替其本身。即ian=nan=nn iang=iaa=naa=na iong=ioo=noo=no但韵母“iao”中的“i”不在换直接将其首尾字母取出代留其本身,即iao=io由于手写体“nn(ian)”连笔以后很容易被误做声母“m”因而我们便用单个的字母“n”表示“ian”即ian=nn=nB、将韵母“uan 、uai、uaa(uang)”中的字母“u或 换做“o”然后再取其首尾字母代替其本身,uan=oan=on Uai=oai=oi uaa=oaa=oa4、“er”改做“ea”即er=ea5、“uo”直接以“o”表示,即uo=o6.定音符由于部分汉字拥有纯韵母的注音,如祆(ao)、藕(ou)等,而汉字在使用时多数以双字词或多字词的形式存于句子中表达意思,为了让大脑通过视觉快速反应词句的内容,我们在书写字母汉字时需要让两字或多字的词连体出现,为了避免误读,要给无声母的纯韵母音节加定音符。
A、a、e两字母单独做注音,后面须坠以字母“u”做定音符即“阿”的注音为“au”“恶”的注音为“eu”B、o、ao、ai、an、aa(ang)、ei、en、ee(eng),ou九个韵母单独做注音时后面须坠以“e”做定音符即“袄”的注音为“aoe”;“爱”的注音为一aie”;“喔”的注音为“oe”;“恩”的注音为“ene”。
C、ea(er)不需加定音符至此,我们对汉语拼音方案所做的改变基本结束,在改动的幅度上是比较大的,但我们有简单明了的改动规则,只要顺着改动的思路去记应该是很容易掌握的,在改动后,二十六个拉丁字母中回a、o、e、i、u、n”六个便成了韵母专用字母,其余的二十个则是声母专用字母,这样便不会出现开头那种“她”、“弹”、变“探”、“汤”的错误,这种截然分明的效果直接作用到读音上,让我们对任何字识读起来都有一种“绰绰然有余裕哉”的感觉。
二、形符规则1、汉字笔化的字母定义由于构成汉字的最基本单位是笔划,所以我们首先对笔化进行字母定义,我们把笔划分为八种,一般的以笔划俗名注音的声母做它们的定义字母即“一”俗名为“横”其注音为“hee(heng)”则字母定义为“h”“丨”俗名为“竖”其注音为“su(shu)”则字母定义为“s”“丿”俗名为“撇”其注音为“pie”则字母定义为“p”“_”俗名为“捺”其注音为“va(na)”则字母定义为“v”“丶”俗名为“点”其注音为“dn(dian)”则字母定义为“d” 俗名为“提”其注音为“ti”则字母定义为“t”“亅、、”我们把这种由上向下竖向起折的笔划称为“钩”其注音为“gou”则字母定义为“g”;乙”我们把这种由左向右、横向起折的笔划称为“弯”其注音为“wan”则字母定义为“w”。
2、部首(形符的又一称谓)汉字中,形声字的比例在百分之八十以上,这个数字不禁令人有此一问为什么形声字的字量这样多呢?让我们先看几组形声字A松、柏、杨、梅等形为“木”表示它们为树木B、鸡、鸭、鹅、鹰等形为“鸟”表示它们为鸟类C、鲤、鲢,鲫、娼等形为“鱼”表示它们为鱼类D、外钢、铁、铜、银等形为“金”表示它们为金属E、猫,狗、猪、猴等形为“犭”表示它们为兽类此类多字同形的例子在汉字中不胜枚举,由此可见自然界里这种花草树木、飞禽走兽乃至所有万物各以类分的现象,为形声字的取形提供了极大的方便,这也许是形声字在汉字中一枝独秀的重要原因,而形声字的这一特点,也使得它的形极具规律性,并且早就在字典的部首查字法中得到利用,我们刚才提到的“木、鸟、鱼、钅、犭、”在部首查字法中就被称做部首,部首也可以说是形声字的形符集合,有了这层认识我们取形就方便了,因为部首查字法是我们在小学就练就的本领。找汉字的部首应是驾轻就熟的。当然,我们在对汉字字母化时,形符要表示成字母,形符既与部首划等号,那么就需要索取部首的字母,这对于是字的部首来说很简单。但是汉字从甲骨文发展到简化字,许多本能单独做字使用的部首,已变的不伦不类,象“忄”、“讠”、“氵”等,虽能表达出形的意思,然若单独来看就根本称不上字了。所以给这些非字型的部首进行字母定义是我们遇到的又一个问题。在解决的办法上,我们把非字型的部首分成三类,即汉字变形类,俗称类,纯笔划类各自来说。需要注意的是我们视单笔划横、竖、撇、捺等不为部首A汉字变形类这类部首一般是可单独使用的汉字的变形体。对于它们,我们一律视其同等于原汉字,字母定义即取原汉字的声母。
例如“钅”为“金”的变形体 字母定义为“金”的声母“j”“亻”为“人”的变形体 字母定义为“人”的声母“r”“攵”为“文”的变形体 字母定义为“文”的声母“w” 为“刀”的变形体 字母定义为“刀”的声母“d”“讠”为“言”的变形体 字母定义为“言”的声母“y”(其余详见附表)B、俗称类这类非字型的部首一般有较广泛的称呼,它们的字母定义为其称呼首字的声母例如“疒”俗称“病率框”称呼首字为“病”则其字母定义为“b”“_”俗称“虎字头”称呼首字为“虎”则其字母定义为“h”“宀”俗称“盖”称呼首字为“盖”则其字母定义为“g”“纟”俗称“绞丝”称呼首字为“绞”则其字母定义为“j”另外为了减少音同形同字,我们把非字型部首“艹”与字型部首“木”重新改名归入此类中进行字母定义“艹”取名为“芳草头”称呼首字为“芳”则其字母定义为“f”“木”取名为“林木旁”称呼首字为“林”则其字母定义为“l”(其余详见附表)C、纯笔化类这类非字型部首一般指既无字样,又没有广泛称呼的一类,它们的字母定义,以其首笔划定义字母为准
例如“巳”首笔划为 称做“弯”字母定义为“w” 首笔划为“一”称做“横”字母定义为“h”“勹”首笔划为 称做“撇”字母定义为“p”“髟”首笔划为“一”称做“横”字母定义为“h”同样为减少同音同形字,我们把“氵”三点水旁,“阝”左、右耳旁,归入此类中进行字母定义“氵”首笔为 字母定义为“d”“阝”首笔为 字母定义为“W”另外对注音无声母的部首也归入此类字母定义i“儿”注音无声母,首笔划为“丿”撇字母定义为“p”“耳”注音无声母,首笔划为“一”横字母定义为“h”其次一些古字部首如 “彳”“巛”“彡”等也归入此中进行字母定义 首笔为 定义字母为“g”“彳”首笔为 定义字母为“p”“巛”首笔为 定义字母为“g”“彡”首笔为 定义字母为“p”(其余详见附表)3、删除掉的几个部首由于在本方案的实际操作当中,传统上列入部首的部分笔划结构,失去了其作为部首存在的意义,所以我们把其删除,被删除的有下列几个“二”、 “采”、“攴”、“疋”、“屮”、“肀”、 “亠” 4、汉字笔划间的关系A、相离二、小笔划与笔划间有一定的空间距离;B、相连弓、工一笔与另一笔连接在一起但不侵入对方;C、相交韦、 一笔与另一笔交叉相互切割;5、无部首字与有部首字形声字定义为,一半表形、一半表声的汉字,从这个概念上看形声字应是由两个字组成的,即表形的是一个字,表声的也是一个字,之所以这样说是因为只有字才能表示事物的形状或意思,只有字才会有读音,但是我们在部首的情况中了解到,许多形声字的形在漫长的历史演化过程中,已变的不能单独做字使用了,因此、从严格意义上来讲,把形声字理解为是有两个字组成的就不确切了,但是说形声字是由表形与表声的两部分组成的还是可以的,由于绝大部分的汉字是形声字,所以由形声字的概念,我们可以得出这样一个结论大部分的汉字是可以一分为二的,也就是说汉字的结构大多为二元性。为了便于分析确定形符,我们对所有的汉字都进行二分。但有不可分与可分之别,所谓不可分是指二分的两部分有笔划相交时不分。或二分的两部分中,一部的笔划深入另一部分,并与另一部分的笔划相连时不分,另外分出的两部分若都不含有字也不分。简洁的说出来就是相交不分,深入相连不分,分不出字来不分,反之便为可分,在进行二分时我们视含在汉字中的数字“一”“二”“三”为纯粹的笔划不为字,但视非字形的部首同等于汉字,并优先让它们占据二份中的一份。其次,字中若没有非字型部首,我们便让字型部首字优先占据一份。另外,一个字中若出现多个非字型部首或多个字型部首时则以先写出的为准。但能分时,我们以可分成两个字为最佳的分法,当笔划连接为一体的汉字,可以分出一字却有多种分法时,我们以可分出部首为准,可分出多个部首,则以先写出的为准。其次,我们把不可分的汉字称做无部首字。可分的汉字称做有部首字,并把有部首字归纳为上下、左右、内外三种结构A无部首字例如“事”末笔划贯穿上下,相交不分为无部首字;“册”本笔划横穿左右,相交不分为无部首字;“木”上部笔划“丨”深入下部“八”中并与其笔划相连而不分,为无部首字;“且”下部笔划 深入上部。 中并与其笔划相连而不可分成上 下“三”样子,故为无部首字;“里”上下两部被其竖笔交连为一体不可分为无部首字;“丽”分不出字来不分为无部首字;“儿”分不出字来不分为无部首字;“三”可分成上“一”下“二”的两部分,但我们视“一”、“二”不为字,所以亦分不出字来不分为无部首字B、有部首字例如上下型“冒”上为“曰”下为“目”为有部首字“哭”上为 下为“犬”为有部首字“品”上为“口”下为 为有部首字“幕”上为“莫”下为“巾”为有部首字,如果让非字型部首“艹”优先占据一部,分成上“艹”下 的样子便会使下部总起来不是字,从而达不到两分皆字的最佳效果,故不取。
“坐”上为“从”下为“土”为有部首字,按国家、规定的标准字体(字典亦可证实)“坐”字上部的两个“人”是不与下部相连的,所以其下部“土”字的“丨”笔虽深入上部亦可分;“天”上为“一”下为“大”能分出“大”字,为有部首字,咋看起来,“天”也可分成“二”与“人”的样子,但这样上下两部笔划相交,故不取;“虫”上为“中”下为“一”能分出“中”字,为有部首字,“严”上为 下为“厂”能分出“厂”字,为有部首字,看上去“严”也可分成上“亚”下“丿”的样子,但“亚”不为传统意义上的部首,故不取;“产”上为“立”下为“丿”为有部首字,其实“产,’分做上 下“厂”也是可分出部首的,但“立”为先写出的部首,故不取后者;“页”上为“丆”下为“贝”为有部首字,“页”字与“产”字情况相同,因而我们亦不取上 下“人”的分法。
左右型“林”左为“木”,右为“木”为有部首字、“恻”左为“·卜,右为“则”为有部首字、“倒”左为“亻”,右为“到”为有部首字、“倒”字分成左“侄”右“刂”也有两分皆字的效果,但非字型部首“亻”较“刂”先写出所以我们不取后者。
“彬”左为“林”右为“彡”为有部首字,“彬”分做左“木”右“杉”也是分做两个字。但我们优先让非字型的部首“彡”占据两部分中的一部分,故取前者。
“成”左为 右为“戈”可分出“戈”字为部首。
内外型“田”外为“口”内为“十”为有部首字“围”外为“口”内为“韦”为有部首字“匍”外为“勺”内为“甫”为有部首字“远”外为“辶”内为“元”为有部首字,对这种一部分被另一部分半包围的字,我们亦视其为内外结构。
“栽”外为 内为“木”为有部首字,“木”为 半包围“裹”外为“衣”内为“果”为有部首字,对这种一部被拆开的一字夹在中间的情况,我们也视其为内外结构,这时其内部笔划与外部笔划须呈相离状态。
“衍”外为“行”内为“氵”为有部首字,“行”字拆开夹住“氵”“辫”外为 内为“纟”为有部首字,对这种由相同的字夹住一部的情况,我们亦视其为内外结构,这时其内外部笔划亦须呈相离状态。
“斑”外为 内为“文”为有部首字,“文”被 夹“器”外为 内为“犬”为有部首字,“犬”被 夹“为”外为 内为“力”为有部首字,对这种去掉点笔,可成一字的情况我们亦被其为内外结构,并以点为外部结构,“玉”外为 内为“王”为有部首字、“办”外为 内为“力”为有部首字、6.无部首字形符的确定对无部首字的两个输字形符,我们采用砍头、去尾、首末笔法三步确定,即当去掉无部首字的首笔划,可另成一个能单独使用的汉字时,我们便以所成字(该字不为古僻字)的声母做原字的第一个形符,以去掉的首笔划的定义字母做它的第二个形符。此便为砍头,当砍头不是字母时,我们便再用“去尾”,即去掉无部首字的末笔可另成一单独使用的汉字时,我们便以所成字(该字仍不为古僻字)的声母做原字的第一个形符,以去掉的末笔划的定义字母做它的第二个形符。当无部首字“砍头”,“去尾”都不能另成字时,我们便以它的首求两笔划做形符,即以首笔划的定义字母做它的第一个形符,以末笔划的定义字母做它的第二个形符,单笔划的汉字则将其笔划定义字母双写。例如“夫”无部首字,去首笔可成字“大”则其第一个形符为“d”第二个形符为首笔划“一”的定义字母“h”,和起来便为“dh”,那么“夫”便可字母化为“fudh”。
“世”无部首字,去首笔不成字,但去尾笔可成字“廿”则其第一个形符“v”第二个形符为末笔划 的定义字母“g”,那么“世”便字母化为“sivg。
“木”无部首字,去首、尾笔都不成字,则其第一个形符便为它的首笔划“一”的定义字母“h”,第二个形符便为它的末笔划“_”的定义字母“v”那么“木”便字母化为“muhv”。
“乙”无部首字,单笔划汉字,则其两个形符为它笔划“乙”的定义字母双写,是为“ww”那么“乙”便字母化为“yiww”。
7.有部首字形符的确定本类字的形符,一般由部首决定,所以先要说一下取部首的办法,我们把可以二分的汉字称做有部首字,目的是为了便于确定一个取部首的统一规则,但实际的应用当中,大部分的汉字,一部分与另一部分间,呈现出的是一目了然的相离状态,除少部分的连体字及多部首字外,并用不着对其进行刻意的二分,所以在一般情况下,直接寻部首便是,为了快速准确的提取部首,我们归纳了以下几种办法。
A①整取法即所取部首,尽量能完全占字的一个纵部结构。例如
“哭”取完全占有其下部结构的“犬”做部首,不取“口”“聂”取完全占有其上部结构的“耳”做部首,不取“又”“沿”取完全占有其左部结构的“氵”做部首,不敢“几”或“口”“载”取完全占有其内部结构的“车”做部首,不取“十”或“戈”“辩”取完全占有其内部结构的“讠”做部首,不取“辛”,部首“辛”只占其外部结构 中的一半。
②余字法就是取出部首后,余下的部分能做汉字单独使用。此法一般用在整取法不能确定部首时,这时汉字一般有多个部首,且都能整取,例如“则”左右都是部首,且都能整改,但取“刂”可余汉字“贝”,便取“刂”做部首,“匡”内外都是部首,且都能整取,但取“匚”可余汉字“王”,便取“匚”做部首“幕”取“巾”做部首,可余汉字“莫”,但取“艹”所余 非汉字,所以取“巾”做部首。
③分类法就是先取非字型部首,再取字型部首,这是字的多个部首都可以整取,但整取余字不能确定。
例如“总”取非字型的部首“丷”不取下部字型的“心’“彬”取“木”做部首可余“杉”字,取“彡”做部首可余“林”字,都可余字则取非字型的“彡”做部首。
④结构法就是按照字体的结构,先取上部的部首,后取下部的部首,先取左部的部首,后取右部的部首,先取外部的部首,后取内部的部首。这个方法一般用在整取、余字、分类都不能确定部首时,或者字的部首不能做到整取时。
例如“尖”上、下都是部首,整取、余字、分类不能确定,我们便按先上后下的办法,取上部“小”做部首。“倒”左、右都是部首,整取、余字、分类亦不能确定,我们便按先左后右的办法,取左部“亻”做它的部首。
“疑”它的部首,不能占有该字的一个结构纵部即不能整改,我们便按先左后右的办法把该字的左部 提出然后再按先上后下的办法取上部 做的部首。
⑤弃声法就是尽量不取与该字注音相同的部首,作形符,这时字的部首必须是字型部首。之所以这样做,是由于我们的字母化公式是根据形声字的造字原理演绎得出,因而在一定程度上,还会受到形声字某些特点的约束,请看下例a.取与该字注音相同的部首做形符。
方块汉字=注音十形符-字母汉字功=goo+g(工)=goog汞=goo+g(工)=goog贡=goo+g(工)=googb,取与该字注音不相同的部首做形符方块汉字=注音十形符。字母汉字功 =goo+l(力)=gool汞 =goo+s(水)=goos贡 =goo+b(贝)=goob由上例可见,对于形声字来说,若以它的“声”做部首,就会增加形成同形同音字母汉字的机率,因此在一定情况下舍声不取是很必要的。当然,我们把形符作为区别同音不同形汉字的符号,在一定程度上也是不必完全拘泥于形声字的桎梏,而且我们的整取、余字、分类三法是主要依据形声字的特点制定的,在一般情况下取声做部首的机率并不大,因此我们规定,只有当将要取的部首的注音与被取部首字的注音相同时,才怀疑该部首是声,这时可将其舍弃另取,但是该部首必须是字型部首,非字型部首不在弃声法之列。
例如“视”部首“礻”是“示”的变形体,尽管“示”的注音与“视”的注音相同,但“礻”为非字型部首,所以我们仍选“礻”做部首。
⑥迫取法就是被迫取一些不是部首的字来做部首使用,或者被迫取与它注音相同的部首做它的形符。
例如“虫”占有一个结构纵部的“中”不是部首,而这个字不能再分,所以我们便强取“中”做部首。
“赖”左、右两部各自总起来看都不是部首我们便按先左后右的结构法原则迫取其左部“束”做部首。
“叛”左、右两部亦非部首,我们取右部“反”做部首,其左部 不是正规字体为了减少判断上的麻烦,迫取时尽量取字体正规的字做部首。
“巩”左部“工”与“巩”的注音相同,按弃声法的原则须舍“工”不取,但是“凡”不是传统意义上的部首,对于这种情况,我们需强取“凡”做部首,但有条件,即舍弃同音部首后,另取的做部首的字,注音也不能与被取部首字相同,如下例中;“励”它的部首“力”与它注音相同,但其左部的“厉”也与它注音相同,这时我们若强取“厉”做部首,也不能达到弃声的效果,对于这种情况,我们仍以传统意义上的部首“力”做形符。
以上便是我们取部首的六条规则,在这六条规则中,前四条的顺序性很强。在对字确定部首时,尽量先用整取法,次用余字法,再用分类法后用结构法,并且能用整改法确定的就不再用其后三种法,能用余字法确定的则不再用其后二法,能用分类法确定的则不在用第四种结构法,若打破这个顺序,则就可能产生矛盾,比如“幕”若先用分类法便须取“艹”做部首,但是用余字法则只能取“巾”做部首,因此象此类能由余字法确定的是不可以再用第三种方法分类去确定部首的,至于弃声法与迫取法则是对前几种方法的订正与补充是需放到最后去衡量所取部首是否得当的两条内容。
B、有了取部首的规则,便可以说有部首字形符的确定方法了,一般的我们先取出有部首字的部首做它的第一个形符,其第二个形符则分两种情况进行确定一、当取出部首后,该字所余下的部分若为有部首字或为有部首的非字型笔划结构时,则取所余部分的部首做它的第二个形符;二、当取出部首后,所余部分为无部首字,或无部首字的非字型笔划结构时,则按无部首字形符的确定方法,即用砍头、去尾、首末笔法,找出所余部分的第一个形符,做有部首字的第二个形符。
例如“魏”整取法可确定其部首为右部“鬼”则其第一个形符为“g”,所余“委”仍为有部首字,结构法可确定其上部“禾”为部首,则其第二个形符为“h”,那么“魏”可字母划为“Weigh”。
“铅”整取法确定其部首为左部“钅”其第一个形符为“j”,所余 为有部首的非字型笔划结构,结构法可确定其上部“几”为部首,则其第二个形符仍为“j”那么“铅”便可字母化为“qnjj”。
“释”整取、余字、分类不能确定其部首,用结构法可取出其左下部“米”做部首,则其第一个形符为“m”所余部分 再用结构法可取出部首“又”那么其第二个形符便为“y”该字则可字母划为“simy”。
“付”余字法可确定其部首为左部“亻”则其第一个形符为“r”所余“寸”为无部首字,砍头去尾不成字,便取“寸”首笔划“一”的定义字母,则其第二个形符为“h”,那么“付”便字母划为“furh”。
“曹”整取可确定其部首为下部“日”则其第一形符为“r”所余 为无部首非字型笔划结构,按无部首字的形符确定规则,砍头即去首笔划可得字“曲”,取“曲”字的声母做“曹”的第二个形符为“q”那么“曹”字便可字母化为“caorq。
三、字母汉字输入方块汉字时的几个问题。
A、输入的方式由于我们已把声母用字母与韵母用字母严格的区分开来,并且对纯韵母注音设置了定音符,所以原则上是可以进行不加空格键的整句输入的。即可以象写方块汉字一样依次排开,只用标点符号对句子加以间隔,但这样会增加字母汉字在识读上的困难,因此,在输入时,我们尽量以词组或短语为单位进行输入,比如“我们去北京好吗?”这句话便可分成“我们—去北京—好吗?”三个段落输入,这样音节长度适中,一旦字母汉字落实应用便可毫不费力的拼读识字。
B、无形符字、单形符字、双形符字、三形符宇我们规定用两个形符做输字的表准是迫于汉字同音字太多的缘故,但汉字无声调的音节有三百多个,即便不用形符,也可以表示出三百多个字,并且可供形符使用的字母有二十个(即声母用字母),用一个音节加一个形符的方式表示一个字的话,在理论上也是可以表示出六千多个字。而生活中最常用的汉字,仅有三、四千个,所以我们是有能力用一个形符、甚至不用形符表示一些常用汉字的,因此实际的字母汉字并非一律拥有两个形符,按照日常使用的频率,我们把每个音节上最常用的一个汉字选出来,单独用音节表示它,并称它们为无形符字,如“我”、“你”、“他”、“好”、“坏”、“高”、“低”、“大”‘、“小”、“很”、“和”’、“前”、“后”、等。一般的无形符字,多为人称代词、用意广泛的动词、形容词、副词、连词、及方位名词。
其次,再选出部分常用字,按照其部首情况用一个形符确定它们,即去掉它们的第二个形符。对于这种字,我们称其为单形符字。单形符字多为常见的实物名词与行为动词,如“狗、gouq”、“猫、maoq”、“打、dat”、“砍、kans”、“跳、tioz”等等。
对次常用字及一些用单形符确定不了的常用字,我们仅用两个形符表示,并称它们为双形符字。双形符字的使用范围一般比较固定,如姓氏“刘、liudy”、“固定”的“固、guks”等。
另外,汉字的历史比较悠久,除了常用字和次常用字外还有大量的古字、繁体字存在,这部分字一般情况下用不着,但也有偶尔用到的时候。事实上我们平常看报纸就不能完全避免、尤其对研究中国古文化的专业人士来讲更是缺之不可。对这部分没有不行,有了又常被闲置的汉字,我们便在其两个形符之上再加一个形符来表示它们,其第三个形符的取法分为两种情况一、当古、繁体字为无部首字时,其第三个形符为它第二形符的双写,如 字母化为“sigdd”;二,当古、繁体字为有部首字时,其第三个形符同于它第二个形符的取法,如 字、先左后右第一个形符为“s(山),’,所余 右部为部首,其第二个形符便为“g(戈)所余 按余字法可得部首“_(虎字头)”则第三个形符便为“h”那么 可字母化为“xisgh”。
C、词的缩写;对一些常用的固定词,我们也象英文一样,取其每个字的首个字母做它们的缩写,且缩写的字母间也加间隔号“·”。缩写的词,在句子中一般和它前面或后面的隔开,即要有空格。
D、同音同形字的处理方法由于汉语的每个音节上分配的汉字、部首极不平均,在按规则对方块汉字字母化时,偶尔会有同音同形字出现,这种情况有一部分可被无形符字及单形符字分流,即同音同形字中较常用的字被减掉一个或全部形符成为单形符字或无形符字,从而将它们分别开来。不能分流的,我们一般采用“换取部首法”即将同音同形字中不常用的一个或几个字会掉其按规则取出的部首,去取字中含有的另外部首或字做形符,比如“伏”与 二字同字母化为“furd”这时我们便对不常用的 字实行“换取部首法”即不先取” ”中的“亻”做部首,而是先强取其右部的“夫”字做部首,则其第一个形符为“f”所余“亻”为无部首的非字型笔划结构,砍头、去尾不是字,则以所余首笔划“丿”的定义字母“p”做它的第二个形符。那么 便字母化为“fufp”,如此便与“伏”字分别开来,如果“换取部首法”不能解决及同音同形字无其它部首可换时,或同音同形字都为无部首字时,我们便给其中不常用的字加第三个形符,在取法上同于古字与繁体字的取法。
E、分音号“,”的用法在汉语中有许多的单纯词如玻璃、编幅、喇叭、尴尬等及一些外来音译词如一些国家的名子或地名俄罗斯、赞比亚、佛罗伦萨等这些由单字组成的词,若单看其中任一字,实际上都是毫无意义可言的,这些字用两个形符来表示,是没必要的,也是很麻烦的,对于它们我们便用分音符来简化。一般的单纯词中的字,我们都加一个形符,然后在其第一个字与第二各字间加分音号;音译的外来词则一般不加形符,只在其前两字间加分音号,如“玻璃”写作“bow’liw”“喇叭”写作“lak’bak”“蝙蝠”写作“bnc’fuc”“俄罗斯”写作“eu’losi”“赞比亚”写作“zan’biya”“佛罗伦萨”写作“fo’lolunsa”
另外,汉语中常用的固定词组,若要和其末字的缩写搭配时也可用分音号,如“新闻”xin’w”其中“新”为无形符字。需要注意的是加分音号的词也尽量不要与它前面或后面的词连写即要单独输入。
F对不知注音的字与不知怎样取部首的字的处理方法不知注音的字在输入时,可依次打出其前六笔划的定义字母,去检索该字,不足六笔划的补空格键。
不知怎样取部首的在输入时,可仅打出其注音去检索。
G、一字多音的处理汉字中有许多一字多音的情况比如“长”既可以读做“caa”又可以读做“zaa”这种情况由于其注音的不同,可以自然的字母化成两个字,但有些字却不行,比如“好人”的“好”与“爱好”的“好”两“好”意思不同,声调不同根本就是两个字,然按字母化规则,却会字母化成相同的字,此种由方块汉字自身特点造成的缺憾,我们是不能让其在字母汉字中延续下去的。对此种情况的处理,我们便以最常用的“好hao”做无形符字写做“hao”而以使用稍低的“好”做单形符字写做“haov”即以改变二者形符的方式把它们区分开来。
以上便是我们对汉字实施字母化的主要内容。在本方案中,微机的汉字输入是实现汉字字母化的重要手段,因而本方案也可以称做字母汉字输入法,只要在输入过程中掌握了无形符字、单形符字及双形符字,那么真正的字母汉字便也基本收入你的囊中,但是无、单、双三种字不是一时可以熟练的,这就需要初学者要有些耐心,尽量先用两个形符的标准输入法去输入汉字,然后在慢慢学会它们。另外,作为汉字来讲,其实平、卷舌音及声调是它非常重要的两个因素。字母汉字仅靠形符来确定这两个方面实际上就是继承了方块汉字的部分缺点,是改革不彻底的,这也是我们把以上内容上称做“初级草案”的原因所在。在这方面上我们打算这样做,即将来本方案若真能实现汉字的字母转化,成熟的字母汉字正规的印刷体上,便同于现在汉语拼音方案中对声调的表示法即用“-” 、四符号标在字母汉字的韵母上。至于卷舌音汉语拼音方案中,有将手写体的“”zh、“zh”。“sh”写成 “_”样子的规定。我们也沿袭过来。表示在卷舌音的“z”、“c”、“s”声母上。这样我们不但可以在字母汉字上直接获得平、卷舌音与声调的信息,而且这样的标志还可以有效的把字母汉字同其它拉丁字母文字区别开来。但手写体可舍去不标。 (1)对部首的注音我们一律按照改后的汉语拼音方案。(2)对“围”字的外部结构“口”我们也视其为“口kou”。 (3)对体形稍扁的“曰”“yue”在做部首时我们也视其为“日ri”

(4)、(5)两部首是重新取名进行字母定义的,但部首“木”仍视为字型部首。 (6)、(7)两部首由于注音无声母,我们故把其放在纯划类中进行字母义,但两部首仍为字型部首。
权利要求
1.一种字母汉字输入法,其特征在于所述的汉字字母化按照如下规则形声字=“声”的注音十“形”的注音声母=字母汉字;或者,方块汉字=注音十形符=字母汉字。
2.根据权利要求1所述的一种字母汉字输入法,其特征在于所述的内容如下(一)注音规则(1)、以字母“v”代替声母“n”;(2)、声母“zh”“ch”“sh”一律去掉”h”,直接写作“z”“c”“s”;(3)、将韵母“ang、eng、ong、ing”改成以其首字母双写的形式代替其本身;(4)、韵母 的表示方法包括(5)、当 单独处于声母“n”“l”之后时,其以双写的“u”表示;(6)、当 与“n”、“l”搭配时 上的两点省略表示为“ue”;(7)、除上面A、B两种情况外 的表示方法都同于原汉语拼音方案。对按照上述1、2两条内容改后仍超过两个字母的韵母做精简处理(8)、将韵母“ian、iaa(iang)、ioo(iong)”中的“i”换做“n”然后再取其改后首尾字母代替其本身;(9)、将韵母“uan 、uai、uaa(uang)”中的字母“u或 换做“o”然后再取其首尾字母代替其本身;(10)、“er”改做“ea”即er=ea;(11)、“uo”直接以“o”表示,即uo=o;(12)、a、e两字母单独做注音,后面须坠以字母“u”做定音符即;(13)、o、ac、ai、an、aa(ang)、ei、en、ee(eng),ou九个韵母单独做注音时后面须坠以“e”做定音符;(14)、ea(er)不需加定音符;(15)、所涉及的二十六个拉丁字母中的a、o、e、i、u、n”六个为韵母专用字母,其余的二十个则是声母专用字母。(二)形符规则(1)、汉字笔化的字母定义所述的笔划分为八种,一般的以笔划俗名注音的声母做它们的定义字母“横”的注音为“hee(heng)”则字母定义为“h”;“竖”的注音为“su(shu)”则字母定义为“s”;“撇”的注音为“pie”则字母定义为“p”;“捺”的注音为“va(na)”则字母定义为“n”;“点”的注音为“dn(dian)”则字母定义为“d”;“提”的注音为“ti”则字母定义为“t”;“钩”的注音为“gou”则字母定义为“g”;“弯”的注音为“wan”则字母定义为“w”;(2)、部首(形符的又一称谓)A、汉字变形类这类部首一般是可单独使用的汉字的变形体。对于它们,我们一律视其同等于原汉字,字母定义即取原汉字的声母。B、俗称类这类非字型的部首一般有较广泛的称呼,它们的字母定义为其称呼首字的声母;C、纯笔化类这类非字型部首一般指既无字样,又没有广泛称呼的一类,它们的字母定义,以其首笔划定义字母为准;(3)、汉字笔划间的关系包括相离、相连、相交;(4)、无部首字与有部首字,将不可分的汉字称做无部首字,将可分的汉字称做有部首字,并把有部首字归纳为上下、左右、内外三种结构;(5)、无部首字形符的确定对无部首字的两个输字形符,我们采用砍头、去尾、首末笔法三步确定;(6)、有部首字形符的确定,将可以二分的汉字称做有部首字。
全文摘要
本发明涉及的是一种字母汉字输入法,尤其是指汉字字母化并使其适合于计算机应用的字母汉字输入法,所述的输入法采用现有键盘的26个字母并根据本发明指定的规则,将汉字(形声字)按照“声”的注音和“形”的注音声母使汉字字母化,在本发明中,微机的汉字输入是实现汉字字母化的重要手段,只要在输入过程中掌握了无形符字、单形符字及双形符字,就可以在实现字母汉字化的同时完成了字母化汉字的输入法。
文档编号G06F3/023GK1405659SQ0112418
公开日2003年3月26日 申请日期2001年8月21日 优先权日2001年8月21日
发明者刘元华, 刘小兰 申请人:刘元华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1