中文归真输入法的制作方法

文档序号:6599434阅读:327来源:国知局
专利名称:中文归真输入法的制作方法
技术领域
本发明属于中文计算机输入技术,是一种以拼音为基础、以词组为主导的中文输入方法。
目前,中文输入方法多达一千种以上,可以分成拼音码、拼形码和音形结合码三大类。拼形码不仅记忆量大,而且需要先写出文稿才能输入,只有专业打字员才能熟练掌握,电脑只能作为誊写工具,远远不能满足普及的要求。拼音码极易学习和掌握,并且也能听想式输入,但由于没有解决同音字的重码问题,输入速度很慢,而且不能输入不认识的字,不能满足高速输入的要求。现有音形结合码主要有“自然码”、“音子码”、“栗氏编码”、“萧码”等,遗憾的是,这些编码都在不同程度上表现出古板、牵强、规律性差、肢解汉字、编码不完善等缺陷,并且都不是真正以词组为主的输入方法。申请号为92113155.0的发明“析音码”虽然建立了“取大原则”和“回避原则”,还对难认字和难拆字进行了单独编码,但没有全程回避,也不是以词组提示为主的输入方法,并且还没有解决全拼码和双拼码的兼容问题。
本发明的目的在于建立完全以词为主的概念,既能以词定字,又能以字定词,词组动态扩充;全拼与双拼兼容为一体,使拼音不准的人也能自我纠正;形码中完全回避字中的表音部分,使重码率控制在百分之一以内,完全消除单字编码中的废码;完全以音代形,使记忆量达到或接近最低限度。真正达到易学、高速、听想输入之目的,使电脑真正成为中文创作的工具,让所有会说普通话的人都能直接使用电脑书写文字。
本发明的目的是这样实现的以改进后的双拼方案为基础,分层提示,采用“万能提示行”实现词组与单字的同时提示和选择;动态改词在提示行中进行;单字编码采用“析音码”的取大原则、回避原则、难字编码等方法,但完全回避表音部分;全拼与双拼兼容。下面结合实例作详细介绍
一、本发明中的拼音码在本发明中,单字编码和词组编码都是由拼音码构成,拼音码分成双拼码和全拼码两种,其中的全拼码与普通汉语拼音完全相同,双拼码在前人的基础上进行了重大改进,现述说如下1、声码为了使声母码(简称声码)自然、规范、重码低、无二义性,本发明的声码按如下规则编码(1)、普通声母码汉语拼音的声母bpfmdtnlgkhzcsr与英文字母同形,其声母码即为对应的英文字母。声母zh,ch,sh分别以英文字母a,w,y作为声母码;由于在j,q,x之后的韵母都是复韵母,并且韵元都是i,本编码码中一律将韵元省略zh<====aji<====jch<====wqi<====qsh<====yxi<====x(2)、虚拟声母虚拟声母专门针对无声母汉字编码。汉语拼音方案中,无声母汉字有单韵母和复韵母两大部分。
单韵母的无声母汉字共有a,e,o三部,本编码一律以e作为其虚拟声母,虚拟声母不发音,仅作为无声母的标志,加韵母之前。即a-eae-eeai-eaien-eenan-eaneng-eengang-eanger-eerao-eaoo-eoou-eou复韵母的无声母汉字共有i,u,ü三部,汉语拼音方案中分别写成y,u,yu,并将其后的单韵母作相应的调整。本编码分别以i,u,v作为其虚拟声母,其后的单韵母不变。
i<==iiu<==uuü<==vvia<==iaua<==uaüe<==veie<==ieuo<==uoüan<==vaniao<==iaouai<==uaiün<==veniou<==iouuei<==ueiüeng<==vengian<==ianuan<==uaniong<==vengin<==ienuen<==ueniang<==ianguang<==uanging<==iengueng<==ueng这样,所有的汉字都具有了声母码,拼音的规范化、统一化得到了进一步的加强,并排除了拼音输入时声母的二义性和韵母的多种输入。
2、韵码汉语拼音中,韵母共有33个,除a,e,i,o,u,ü外,其它韵母均由两个或两个以上的字母组成,本发明均以一个英文字母代替之,简称韵码。由于英文中仅有26个字母,故一些字母要同时代表几个韵母。无韵母时,统一在声母之后加上i。本发明的韵码可采用任何双拼方案韵母码,但默认的韵码是“析音码”的韵母方案,仅uo和ou的对调。具体安排如下
二、万能提示行以提示词组为主,以提示单字为辅。同时实现单字与词组的提示和选取。由于现代汉语主要以词组为主,词组的使用频率和词组的数量又远远大于单字,所以以提示词组为主比较科学、比较实用。方法是仅在0号位提示一个单字,1~6号位提示词组。用数字键提取单字,称为“选字键”;使用“空格;,./[”提取词组,称为“选词键”;两者对应关系为选词键选字键空格0;1'2,3.4/5[6直接按“选字键”选取词中第一个单字,“Ctrl+选字键”选取词中第二单字;“Alt+选字键”重复选取第一单字,“Alt+选词键”重复选取词组。
智能提取输入四码后无重码时,自动选取该字或词组;有重码时,则在输入下一字的编码时,自动提取最前面的词组或单字,词组与单字同码时,词组优先。
如想输入一个可以的“复”字,我们必须输入“复”字的声母码fu,这时提示行出现半角析音(叶码)fu0复1负责2父母3夫妻4妇女5肤浅6俯视数字0123456分别提取“复负父夫妇肤俯”Ctrl+0123456分别提取“复责母妻女浅视”符号;',./[分别提取“负责父母夫妻妇女肤浅俯视”空格键选取0号位的词组或汉字三、本发明的词组编码在本编码中,词组与单字混和输入,以音定词,以词定字,分层提示1、二字词①第一个字的声母(单声简码词组)本系统中有大量的简码词组,这些简码词组主要都是二字词,提示行中除了提示一个简码单字外,还提示六个简码词组。这样一级简码词组就有26×6=156个。
“我们”二字就可以输入“我”字的声母w,提示行中提示“我们”,只要使用选词键即可输入“我们”。
②第一个字的声母和韵母(单音简码词组)汉语拼音中声母和韵母的组合共有四百多个,也就是说共有四百多个音,但常用的仅有390个左右,在本系统中,单音简码词组共有2300个左右。
如“合适”可以输入“合”字的拼音he,提示行中即出现“合适”二字,使用选词键即可输入“合适”。
③第一个字的声母和第二个字的声母(双声简码词)
当双声简码不是一个拼音码时,可以使用两个字的声母作为词组的编码,否则应以单音简码优先。
④两个字的声母和韵母(双音词组码-全码)二字词全码是双音简码,即第一个字的声母和韵母,再加上第二个字的声母和韵母。
如“可以”二字词的全码是“可”字的声韵二码ke,再加上“以”字的声韵xw二码,其全码为keyi。
2、三字词①三个字的声母②三个字的声母加尾字的韵母。
3、四字以上词前三个字的声母加尾字的声母。
四、动态改词法动态改词法是指在输入词组的过程中,用户发现所输入的词组不存在或不必要存在时,可以随意修改的一种方法。用户不仅可以动态造词,还可以动态删词;只要内存允许,可以无限增加词组。
1、动态造词。
输入词组的编码后,如果提示行中没有出现所要的词组,则说明词组库文件中没有该词组。此时,使用造词功能键则可进入词组建立状态,提示行中汉字外码之前的位置空出,作为造词区,再逐个输入词中字或词,自动依次放到造词区中,词组长度超出造词区时,所有的字左移,最前面的字顶出,当前输入的字挤入;输入完毕后,应使用造词结束键退出造词状态,该词自动存入词库和内存中,同时提示行返回正常状态,并将该词放置在其它同码词组之后。
举例动态建立词组“不入虎穴,焉得虎子”首先,输入“不入虎穴”四个字的声母brhx作为“不入虎穴,焉得虎子”的代码,提示行为
半角析音(叶码)brhx提示行中没有任何汉字或词组,表明该代码为空码(不为空码时也同样可以添加词组)。表明“不入虎穴,焉得虎子”词库中和内存中都不存在,此时可以使用动态造词功能将它变成词组。造词前需使用造词功能键将当前的输入状态转换成造词状态。造词功能键是Shift+F2→进入造词状态按下Shift+F2后,即进入造词状态造词brhx接着再逐个输入“不入虎穴,焉得虎子”中的每一个汉字和标点,所输入的汉字字符不出现在文本行,而是出现在提示行的造词区。如输入“不”字后,提示行会变成造词不b0不1必须2并且3本来4不但5不仅6包括造词区仅有五个汉字字符的位置,同时只能提示五个汉字字符,当超过五个汉字字符时,整个造词区左移一个汉字位,第一个汉字字符会被挤出造词区,但实质上被挤出的汉字并没有消失,而只是暂时隐藏起来了,请看本例,输入五个汉字字符时,提示行为造词不入虎穴,xwg0穴再输入“焉”字造词入虎穴,焉yjvy0焉“不”字被从造词区挤走,其它汉字左移,右边腾出一个位置,“焉”字就挤进造词区了,直至输入词组中的所有汉字造词,焉得虎子zi0子1自然2自由3自信4资金5资源6姿态词组中的汉字输入完毕后,计算机并不知道造词完毕,所以此时应告诉计算机,该退出造词状态了,退出造词状态与进入造词状态一样,也是使用功能键Shift+F2Shift+F2→退出造词状态按下Shift+F2后,提示行返回文本输入状态,出现原来输入的词组代码,所造词组也出现在提示行中。同时,还将该词组送到词组库文件中。请见本例半角析音(叶码)brhx0不入虎穴,焉得虎子以后,“不入虎穴,焉得虎子”就可以按词组输入了。
特别要注意的是,造词时,如果词组代码中已有一个单字和词组,则该单字或词组会自动输入到文本文件中,此时我们仍可以使用造词功能键建立另一个词组,即使同码词组多于六个,也同样可以建立自造词组。
2、动态删词在造词状态下,直接键入数字键,则删除对应的词组。
举例删除词组“不入虎穴,焉得虎子”,首先输入brhx,提示行为半角析音(叶码)brhx0不入虎穴,焉得虎子此时,按下Shift+F2键进入造词状态造词brhx0不入虎穴,焉得虎子再键入数字0,提示行变为半角析音(叶码)brhx0词组“不入虎穴,焉得虎子”从提示行中消失,同时也删除了词库中的“不入虎穴,焉得虎子”。提示行中保留数字0,是为了表示刚刚删除了一个词组。
五、归真析音码本发明的单字编码是归真析音码,以“析音码”的拆分原则和回避原则为基础,对汉字中的表音部分进行全程回避。
归真析音码的全码由四码组成,以双拼为基础,使用26个英文字母对单个汉字进行编码,其全码为全码=音码+形码音码=本字声码+本字韵码形码=义码+补码其中声码和韵码是双拼码,已在一、二部分中介绍。
1、字根的编码在本发明中,汉字拆分成首尾两个部分,首部按正向取大原则拆分,尾部按逆向取大原则拆分。首部的编码称为“首码”,尾部的编码称为“尾码”。拆分后的字根的编码为该字根的声母码。字根共有三大类子字、偏旁部首、基本笔画。汉字的拆分方法和标准偏旁部首的规定都采用“析音码”的规则,仅标准偏旁部首的代码作一点变动。见下表
标准字根编码表
2、取义码义码是单字的第三码,取汉字中的表义部分的声码作为编码,以区分同音汉字,绝大部分汉字可在三码以内唯一确定。
根据析音码的拆分规则将汉字拆分成首尾两个部分,首部按“正向取大”原则拆分,尾部按“逆向取大”原则拆分。汉字的首尾两个部分都是给汉字表音或表义的,少量汉字仅有表义部分。由于同音字很多主要原因是字中含有表音部分,所以表音部分的声码就失去了区分同音字的意义,是废码;因而本发明的义码要对表音部分进行回避。义码的取码方法是(1)若首部不是本字的表音部分,则取首部读音的声码,简称首码,作为义码。
(2)若首部不是本字的表音部分,则回避首部,不在首部取义码,改取尾部读音的声码,简称尾码,作为义码,如“汉字编码”的首部“氵宀纟石”都不是本字的表音部分,故直接取它们的首码d,g,s,y作为义码。又如“架裂鸦顶”等字的首部“加列牙丁”都是本字的表音部分,应回避首部,改取尾部“木衣鸟页”的声码m,i,n,i作为义码。
3、取补码补码是单字的第四码,以区分读音相同、义码也相同的汉字。取补码后,国标一、二级字库中的同码汉字仅有60个左右。补码的编码方法如下(1)若本字中没有表音部分,则取尾码作为补码。
(2)若本字中含有表音部分且表音部分为合体字时,取该部分中不表音的子部分的声码作为补码;首部表音时正向取补码,尾部表音时逆向取补码。
(3)若本字中含有表音部分并且表音部分为独体字时,取表义部分中的韵码作为补码。
如“国务委员”不含表音部分,故直接取它们的尾部“玉力女贝”的声码v,l,n,b作为补码。又如“想频梅花”的表音部分分别为“相步每化”,故取它们的子部分“木止母匕”作为补码。再如“诽腓霏鲱”的表音部分“非”为独体字,故取其表义部分的“讠月雨鱼”的韵码j,e,v,v作为补码。
六、全拼兼容法全拼兼容法是一种使全拼和双拼完全兼容的输入方法,适用于所有双拼码、音形结合码,是一种十分实用的全拼码和双拼码的学习方法,使拼音不准确的人员也能在输入过程中自我纠正。
输入任一全拼码时,均提示对应的高频字或词;输入声母之后,若输入的外码不是全拼韵母码,则自动认为该码是双拼韵母码;输入至少一个韵母码之后,若输入的外码不是韵母的一部分时,自动认为韵母码已经输入完毕,并将该码作为形码处理;当韵母已经结束,而输入的形码与原韵母码可以构成另一韵母时,应先输入韵母结束键“空格”,再输入形码;词组输入时,其理亦同。
如输入“晨”字,先输入c,提示行为半角析音(叶码)c0此1曾经2此时3从此4才能5错误6采取用户可以发现,“晨”字的声母不与“此”等字相同,应再按h半角析音(叶码)ch0出1充分2成立3出现4彻底5超过6常常再输入en半角析音(叶码)chen0陈1陈述2沉浸3趁机4衬托5尘土6臣民可以看出拼音输入正确,应再输入“晨”中“日”的声码r半角析音(叶码)wfr0晨1趁热此时,前面的全拼码自动转化为双拼码。由于字母r不能与chen构成另一拼音,所以自动认为拼音码输入完毕,字母r是形码。如果输入chen后,再输入g,则会认为g是韵母的一部分,构成拼音cheng,如果要输入“宸”字,其全拼是chen,其形码是g,如果在输入chen后,直接输入g,则会认为输入的是拼音cheng,故应在输入chen后输入一个空格键表示拼音输入完毕,再输入g,就不会混淆了。
词组输入时,可以将第二字的拼音码如形码一样处理。
七、补充说明1、本发明的学习码可以采用“析音码”的基本码2、循环翻页键是],万能学习键是\3、难认字和难拆字的编码均与析音码相同。
本发明的特点1、由于仅使用拼音对汉字和词组编码,且全拼与双拼兼容,使记忆量达到最低限度。
2、由于词组和单字可以同时提示和选择,使输入速度空前提高,并可以直接在电脑上创作文稿。
3、单字编码简单易学,完全符合汉字的本义,消除了废码,并使重码率仅为百分之一,完全可以盲打。
4、词组动态扩充和删除极为简便,并与文本输入完全兼容。
5、由于采用了“析音码”的难认字和难拆字输入技术,使不认识和难于分解的汉字也极易输入,编码全面完善。
权利要求
1.一种计算机汉字输入方法,以双拼为基础,使用26个英文字母对汉字和词组进行编码,其特征在于提示行以词组为主,分层提示;动态造词在提示行中进行;单字全码为全码=音码+形码音码=本字声码+本字韵码形码=义码+补码其中声码声码用一个字母表示;全拼方案中的声母y,w,yu分别由i,u,v表示;zh,ch,sh分别由a,w,y表示;字母e作为无声母汉字的虚拟声母;其它声码与全拼的声母相同,韵码韵码用一个英文字母表示;可采用任何双拼方案的韵母码。义码将汉字拆分成首尾两个部分,首部按“正向取大”原则拆分,尾部按“逆向取大”原则拆分,(1)若首部不是本字的表音部分,则取首部读音的声码,简称首码,作为义码;(2)若首部是本字的表音部分,则回避首部,不在首部取义码,改取尾部读音的声码,简称尾码,作为义码,补码(1)若本字中没有表音部分,则取尾码作为补码;(2)若表音部分为合体字,则取该部分中不表音的子部分的声码作为补码;(3)若表音部分为独体字,则改取表义部分中的韵码作为补码。
2.一种中文输入方法,称为“万能提示行法”;适用于所有中文计算机键盘输入系统;其特征是以词为主导,逐级提示高频词组,提示词组的同时也认为提示了词中单字;用数字键选取词中第一个单字,称为“选字键”;用符号键选取词组,符号键“;′,./[”分别对应于序号为“123456”的词组,“空格”键对应于0号位的词组,称为“选词键”;“Ctrl+选字键”选取词中第二单字,Alt+“选字键”重复选取词中第一字,Alt+“选词键”重复选取词组。
3.一种中文输入方法,称为“动态改词法”;适用于所有中文计算机键盘输入系统;“动态改词法”由“动态造词”和“动态删词”两个部分组成,其特征是动态造词先输入词组编码,若该词组不存在,则键入一功能键,进入造词状态;此时,提示行中汉字外码之前的位置空出,作为造词区,再逐个输入词中字或词,自动依次放到造词区中,词组长度超出造词区时,所有的字左移,最前面的字顶出,当前输入的字挤入;输入完毕后,键入造词结束键。该词自动存入词库和内存中,同时提示行返回正常状态,并将该词放置在其它同码词组之后,动态删词先输入词组编码,再进入造词状态,直接键入所要删除的词组之前的序号,就可以删除该词组,同时提示返回正常状态。
4.一种汉字输入方法,与“权利要求书1”兼容,以全拼为基础,使之与双拼兼容,称为“全拼兼容法”,适合于所有以音为基础的编码;其特征在于输入任一全拼码时,均提示对应的高频字或词;输入声母之后,若输入的外码不是全拼韵母码,则自动认为该码是双拼韵母码;输入至少一个韵母码之后,若输入的外码不是韵母的一部分时,自动认为韵母码已经输入完毕,并将该码作为形码处理;当韵母已经结束,而输入的形码与原韵母码可以构成另一韵母时,应先输入韵母结束键“空格”,再输入形码;词组输入时,其理亦同。
全文摘要
中文归真输入法,属于一种计算机输入方法,是以词为主,以字为辅,以音定词,以词定字。采用万能提示行和动态改词法等技术,使词组输入简单、快速、扩充方便。单字编码由音、形两部分构成,音码采用改进双拼方案,形码完全回避字中的表音部分,并完全以音代形,使记忆量和重码率均接近最低限度。是一种能用电脑取代书写的输入技术。
文档编号G06F3/023GK1094171SQ9410311
公开日1994年10月26日 申请日期1994年3月23日 优先权日1994年3月23日
发明者叶冠卿 申请人:叶冠卿
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1