中文归真输入法的制作方法

文档序号：6599434阅读：327来源：国知局

专利名称：中文归真输入法的制作方法
技术领域：
本发明属于中文计算机输入技术，是一种以拼音为基础、以词组为主导的中文输入方法。
目前，中文输入方法多达一千种以上，可以分成拼音码、拼形码和音形结合码三大类。拼形码不仅记忆量大，而且需要先写出文稿才能输入，只有专业打字员才能熟练掌握，电脑只能作为誊写工具，远远不能满足普及的要求。拼音码极易学习和掌握，并且也能听想式输入，但由于没有解决同音字的重码问题，输入速度很慢，而且不能输入不认识的字，不能满足高速输入的要求。现有音形结合码主要有“自然码”、“音子码”、“栗氏编码”、“萧码”等，遗憾的是，这些编码都在不同程度上表现出古板、牵强、规律性差、肢解汉字、编码不完善等缺陷，并且都不是真正以词组为主的输入方法。申请号为92113155.0的发明“析音码”虽然建立了“取大原则”和“回避原则”，还对难认字和难拆字进行了单独编码，但没有全程回避，也不是以词组提示为主的输入方法，并且还没有解决全拼码和双拼码的兼容问题。
本发明的目的在于建立完全以词为主的概念，既能以词定字，又能以字定词，词组动态扩充;全拼与双拼兼容为一体，使拼音不准的人也能自我纠正;形码中完全回避字中的表音部分，使重码率控制在百分之一以内，完全消除单字编码中的废码;完全以音代形，使记忆量达到或接近最低限度。真正达到易学、高速、听想输入之目的，使电脑真正成为中文创作的工具，让所有会说普通话的人都能直接使用电脑书写文字。
本发明的目的是这样实现的以改进后的双拼方案为基础，分层提示，采用“万能提示行”实现词组与单字的同时提示和选择;动态改词在提示行中进行;单字编码采用“析音码”的取大原则、回避原则、难字编码等方法，但完全回避表音部分;全拼与双拼兼容。下面结合实例作详细介绍
一、本发明中的拼音码在本发明中，单字编码和词组编码都是由拼音码构成，拼音码分成双拼码和全拼码两种，其中的全拼码与普通汉语拼音完全相同，双拼码在前人的基础上进行了重大改进，现述说如下1、声码为了使声母码(简称声码)自然、规范、重码低、无二义性，本发明的声码按如下规则编码(1)、普通声母码汉语拼音的声母bpfmdtnlgkhzcsr与英文字母同形，其声母码即为对应的英文字母。声母zh，ch，sh分别以英文字母a，w，y作为声母码;由于在j，q，x之后的韵母都是复韵母，并且韵元都是i，本编码码中一律将韵元省略zh<＝＝＝＝aji<＝＝＝＝jch<＝＝＝＝wqi<＝＝＝＝qsh<＝＝＝＝yxi<＝＝＝＝x(2)、虚拟声母虚拟声母专门针对无声母汉字编码。汉语拼音方案中，无声母汉字有单韵母和复韵母两大部分。
单韵母的无声母汉字共有a，e，o三部，本编码一律以e作为其虚拟声母，虚拟声母不发音，仅作为无声母的标志，加韵母之前。即a-eae-eeai-eaien-eenan-eaneng-eengang-eanger-eerao-eaoo-eoou-eou复韵母的无声母汉字共有i，u，ü三部，汉语拼音方案中分别写成y，u，yu，并将其后的单韵母作相应的调整。本编码分别以i，u，v作为其虚拟声母，其后的单韵母不变。
i<==iiu<==uuü<==vvia<==iaua<==uaüe<==veie<==ieuo<==uoüan<==vaniao<==iaouai<==uaiün<==veniou<==iouuei<==ueiüeng<==vengian<==ianuan<==uaniong<==vengin<==ienuen<==ueniang<==ianguang<==uanging<==iengueng<==ueng这样，所有的汉字都具有了声母码，拼音的规范化、统一化得到了进一步的加强，并排除了拼音输入时声母的二义性和韵母的多种输入。
2、韵码汉语拼音中，韵母共有33个，除a，e，i，o，u，ü外，其它韵母均由两个或两个以上的字母组成，本发明均以一个英文字母代替之，简称韵码。由于英文中仅有26个字母，故一些字母要同时代表几个韵母。无韵母时，统一在声母之后加上i。本发明的韵码可采用任何双拼方案韵母码，但默认的韵码是“析音码”的韵母方案，仅uo和ou的对调。具体安排如下
二、万能提示行以提示词组为主，以提示单字为辅。同时实现单字与词组的提示和选取。由于现代汉语主要以词组为主，词组的使用频率和词组的数量又远远大于单字，所以以提示词组为主比较科学、比较实用。方法是仅在0号位提示一个单字，1～6号位提示词组。用数字键提取单字，称为“选字键”;使用“空格;，./[”提取词组，称为“选词键”;两者对应关系为选词键选字键空格0;1'2,3.4/5[6直接按“选字键”选取词中第一个单字，“Ctrl+选字键”选取词中第二单字;“Alt+选字键”重复选取第一单字，“Alt+选词键”重复选取词组。
智能提取输入四码后无重码时，自动选取该字或词组;有重码时，则在输入下一字的编码时，自动提取最前面的词组或单字，词组与单字同码时，词组优先。
如想输入一个可以的“复”字，我们必须输入“复”字的声母码fu，这时提示行出现半角析音(叶码)fu0复1负责2父母3夫妻4妇女5肤浅6俯视数字0123456分别提取“复负父夫妇肤俯”Ctrl+0123456分别提取“复责母妻女浅视”符号;'，./[分别提取“负责父母夫妻妇女肤浅俯视”空格键选取0号位的词组或汉字三、本发明的词组编码在本编码中，词组与单字混和输入，以音定词，以词定字，分层提示1、二字词①第一个字的声母(单声简码词组)本系统中有大量的简码词组，这些简码词组主要都是二字词，提示行中除了提示一个简码单字外，还提示六个简码词组。这样一级简码词组就有26×6＝156个。
“我们”二字就可以输入“我”字的声母w，提示行中提示“我们”，只要使用选词键即可输入“我们”。
②第一个字的声母和韵母(单音简码词组)汉语拼音中声母和韵母的组合共有四百多个，也就是说共有四百多个音，但常用的仅有390个左右，在本系统中，单音简码词组共有2300个左右。
如“合适”可以输入“合”字的拼音he，提示行中即出现“合适”二字，使用选词键即可输入“合适”。
③第一个字的声母和第二个字的声母(双声简码词)
当双声简码不是一个拼音码时，可以使用两个字的声母作为词组的编码，否则应以单音简码优先。
④两个字的声母和韵母(双音词组码-全码)二字词全码是双音简码，即第一个字的声母和韵母，再加上第二个字的声母和韵母。
如“可以”二字词的全码是“可”字的声韵二码ke，再加上“以”字的声韵xw二码，其全码为keyi。
2、三字词①三个字的声母②三个字的声母加尾字的韵母。
3、四字以上词前三个字的声母加尾字的声母。
四、动态改词法动态改词法是指在输入词组的过程中，用户发现所输入的词组不存在或不必要存在时，可以随意修改的一种方法。用户不仅可以动态造词，还可以动态删词;只要内存允许，可以无限增加词组。
1、动态造词。
输入词组的编码后，如果提示行中没有出现所要的词组，则说明词组库文件中没有该词组。此时，使用造词功能键则可进入词组建立状态，提示行中汉字外码之前的位置空出，作为造词区，再逐个输入词中字或词，自动依次放到造词区中，词组长度超出造词区时，所有的字左移，最前面的字顶出，当前输入的字挤入;输入完毕后，应使用造词结束键退出造词状态，该词自动存入词库和内存中，同时提示行返回正常状态，并将该词放置在其它同码词组之后。
举例动态建立词组“不入虎穴，焉得虎子”首先，输入“不入虎穴”四个字的声母brhx作为“不入虎穴，焉得虎子”的代码，提示行为
半角析音(叶码)brhx提示行中没有任何汉字或词组，表明该代码为空码(不为空码时也同样可以添加词组)。表明“不入虎穴，焉得虎子”词库中和内存中都不存在，此时可以使用动态造词功能将它变成词组。造词前需使用造词功能键将当前的输入状态转换成造词状态。造词功能键是Shift+F2→进入造词状态按下Shift+F2后，即进入造词状态造词brhx接着再逐个输入“不入虎穴，焉得虎子”中的每一个汉字和标点，所输入的汉字字符不出现在文本行，而是出现在提示行的造词区。如输入“不”字后，提示行会变成造词不b0不1必须2并且3本来4不但5不仅6包括造词区仅有五个汉字字符的位置，同时只能提示五个汉字字符，当超过五个汉字字符时，整个造词区左移一个汉字位，第一个汉字字符会被挤出造词区，但实质上被挤出的汉字并没有消失，而只是暂时隐藏起来了，请看本例，输入五个汉字字符时，提示行为造词不入虎穴，xwg0穴再输入“焉”字造词入虎穴，焉yjvy0焉“不”字被从造词区挤走，其它汉字左移，右边腾出一个位置，“焉”字就挤进造词区了，直至输入词组中的所有汉字造词，焉得虎子zi0子1自然2自由3自信4资金5资源6姿态词组中的汉字输入完毕后，计算机并不知道造词完毕，所以此时应告诉计算机，该退出造词状态了，退出造词状态与进入造词状态一样，也是使用功能键Shift+F2Shift+F2→退出造词状态按下Shift+F2后，提示行返回文本输入状态，出现原来输入的词组代码，所造词组也出现在提示行中。同时，还将该词组送到词组库文件中。请见本例半角析音(叶码)brhx0不入虎穴，焉得虎子以后，“不入虎穴，焉得虎子”就可以按词组输入了。
特别要注意的是，造词时，如果词组代码中已有一个单字和词组，则该单字或词组会自动输入到文本文件中，此时我们仍可以使用造词功能键建立另一个词组，即使同码词组多于六个，也同样可以建立自造词组。
2、动态删词在造词状态下，直接键入数字键，则删除对应的词组。
举例删除词组“不入虎穴，焉得虎子”，首先输入brhx，提示行为半角析音(叶码)brhx0不入虎穴，焉得虎子此时，按下Shift+F2键进入造词状态造词brhx0不入虎穴，焉得虎子再键入数字0，提示行变为半角析音(叶码)brhx0词组“不入虎穴，焉得虎子”从提示行中消失，同时也删除了词库中的“不入虎穴，焉得虎子”。提示行中保留数字0，是为了表示刚刚删除了一个词组。
五、归真析音码本发明的单字编码是归真析音码，以“析音码”的拆分原则和回避原则为基础，对汉字中的表音部分进行全程回避。
归真析音码的全码由四码组成，以双拼为基础，使用26个英文字母对单个汉字进行编码，其全码为全码＝音码+形码音码＝本字声码+本字韵码形码＝义码+补码其中声码和韵码是双拼码，已在一、二部分中介绍。
1、字根的编码在本发明中，汉字拆分成首尾两个部分，首部按正向取大原则拆分，尾部按逆向取大原则拆分。首部的编码称为“首码”，尾部的编码称为“尾码”。拆分后的字根的编码为该字根的声母码。字根共有三大类子字、偏旁部首、基本笔画。汉字的拆分方法和标准偏旁部首的规定都采用“析音码”的规则，仅标准偏旁部首的代码作一点变动。见下表
标准字根编码表
2、取义码义码是单字的第三码，取汉字中的表义部分的声码作为编码，以区分同音汉字，绝大部分汉字可在三码以内唯一确定。
根据析音码的拆分规则将汉字拆分成首尾两个部分，首部按“正向取大”原则拆分，尾部按“逆向取大”原则拆分。汉字的首尾两个部分都是给汉字表音或表义的，少量汉字仅有表义部分。由于同音字很多主要原因是字中含有表音部分，所以表音部分的声码就失去了区分同音字的意义，是废码;因而本发明的义码要对表音部分进行回避。义码的取码方法是(1)若首部不是本字的表音部分，则取首部读音的声码，简称首码，作为义码。
(2)若首部不是本字的表音部分，则回避首部，不在首部取义码，改取尾部读音的声码，简称尾码，作为义码，如“汉字编码”的首部“氵宀纟石”都不是本字的表音部分，故直接取它们的首码d，g，s，y作为义码。又如“架裂鸦顶”等字的首部“加列牙丁”都是本字的表音部分，应回避首部，改取尾部“木衣鸟页”的声码m，i，n，i作为义码。
3、取补码补码是单字的第四码，以区分读音相同、义码也相同的汉字。取补码后，国标一、二级字库中的同码汉字仅有60个左右。补码的编码方法如下(1)若本字中没有表音部分，则取尾码作为补码。
(2)若本字中含有表音部分且表音部分为合体字时，取该部分中不表音的子部分的声码作为补码;首部表音时正向取补码，尾部表音时逆向取补码。
(3)若本字中含有表音部分并且表音部分为独体字时，取表义部分中的韵码作为补码。
如“国务委员”不含表音部分，故直接取它们的尾部“玉力女贝”的声码v，l，n，b作为补码。又如“想频梅花”的表音部分分别为“相步每化”，故取它们的子部分“木止母匕”作为补码。再如“诽腓霏鲱”的表音部分“非”为独体字，故取其表义部分的“讠月雨鱼”的韵码j，e，v，v作为补码。
六、全拼兼容法全拼兼容法是一种使全拼和双拼完全兼容的输入方法，适用于所有双拼码、音形结合码，是一种十分实用的全拼码和双拼码的学习方法，使拼音不准确的人员也能在输入过程中自我纠正。
输入任一全拼码时，均提示对应的高频字或词;输入声母之后，若输入的外码不是全拼韵母码，则自动认为该码是双拼韵母码;输入至少一个韵母码之后，若输入的外码不是韵母的一部分时，自动认为韵母码已经输入完毕，并将该码作为形码处理;当韵母已经结束，而输入的形码与原韵母码可以构成另一韵母时，应先输入韵母结束键“空格”，再输入形码;词组输入时，其理亦同。
如输入“晨”字，先输入c，提示行为半角析音(叶码)c0此1曾经2此时3从此4才能5错误6采取用户可以发现，“晨”字的声母不与“此”等字相同，应再按h半角析音(叶码)ch0出1充分2成立3出现4彻底5超过6常常再输入en半角析音(叶码)chen0陈1陈述2沉浸3趁机4衬托5尘土6臣民可以看出拼音输入正确，应再输入“晨”中“日”的声码r半角析音(叶码)wfr0晨1趁热此时，前面的全拼码自动转化为双拼码。由于字母r不能与chen构成另一拼音，所以自动认为拼音码输入完毕，字母r是形码。如果输入chen后，再输入g，则会认为g是韵母的一部分，构成拼音cheng，如果要输入“宸”字，其全拼是chen，其形码是g，如果在输入chen后，直接输入g，则会认为输入的是拼音cheng，故应在输入chen后输入一个空格键表示拼音输入完毕，再输入g，就不会混淆了。
词组输入时，可以将第二字的拼音码如形码一样处理。
七、补充说明1、本发明的学习码可以采用“析音码”的基本码2、循环翻页键是]，万能学习键是\3、难认字和难拆字的编码均与析音码相同。
本发明的特点1、由于仅使用拼音对汉字和词组编码，且全拼与双拼兼容，使记忆量达到最低限度。
2、由于词组和单字可以同时提示和选择，使输入速度空前提高，并可以直接在电脑上创作文稿。
3、单字编码简单易学，完全符合汉字的本义，消除了废码，并使重码率仅为百分之一，完全可以盲打。
4、词组动态扩充和删除极为简便，并与文本输入完全兼容。
5、由于采用了“析音码”的难认字和难拆字输入技术，使不认识和难于分解的汉字也极易输入，编码全面完善。
权利要求
1.一种计算机汉字输入方法，以双拼为基础，使用26个英文字母对汉字和词组进行编码，其特征在于提示行以词组为主，分层提示；动态造词在提示行中进行；单字全码为全码=音码+形码音码=本字声码+本字韵码形码=义码+补码其中声码声码用一个字母表示；全拼方案中的声母y，w，yu分别由i，u，v表示；zh，ch，sh分别由a，w，y表示；字母e作为无声母汉字的虚拟声母；其它声码与全拼的声母相同，韵码韵码用一个英文字母表示；可采用任何双拼方案的韵母码。义码将汉字拆分成首尾两个部分，首部按“正向取大”原则拆分，尾部按“逆向取大”原则拆分，(1)若首部不是本字的表音部分，则取首部读音的声码，简称首码，作为义码；(2)若首部是本字的表音部分，则回避首部，不在首部取义码，改取尾部读音的声码，简称尾码，作为义码，补码(1)若本字中没有表音部分，则取尾码作为补码；(2)若表音部分为合体字，则取该部分中不表音的子部分的声码作为补码；(3)若表音部分为独体字，则改取表义部分中的韵码作为补码。
2.一种中文输入方法，称为“万能提示行法”;适用于所有中文计算机键盘输入系统;其特征是以词为主导，逐级提示高频词组，提示词组的同时也认为提示了词中单字;用数字键选取词中第一个单字，称为“选字键”;用符号键选取词组，符号键“;′，./[”分别对应于序号为“123456”的词组，“空格”键对应于0号位的词组，称为“选词键”;“Ctrl+选字键”选取词中第二单字，Alt+“选字键”重复选取词中第一字，Alt+“选词键”重复选取词组。
3.一种中文输入方法，称为“动态改词法”;适用于所有中文计算机键盘输入系统;“动态改词法”由“动态造词”和“动态删词”两个部分组成，其特征是动态造词先输入词组编码，若该词组不存在，则键入一功能键，进入造词状态;此时，提示行中汉字外码之前的位置空出，作为造词区，再逐个输入词中字或词，自动依次放到造词区中，词组长度超出造词区时，所有的字左移，最前面的字顶出，当前输入的字挤入;输入完毕后，键入造词结束键。该词自动存入词库和内存中，同时提示行返回正常状态，并将该词放置在其它同码词组之后，动态删词先输入词组编码，再进入造词状态，直接键入所要删除的词组之前的序号，就可以删除该词组，同时提示返回正常状态。
4.一种汉字输入方法，与“权利要求书1”兼容，以全拼为基础，使之与双拼兼容，称为“全拼兼容法”，适合于所有以音为基础的编码;其特征在于输入任一全拼码时，均提示对应的高频字或词;输入声母之后，若输入的外码不是全拼韵母码，则自动认为该码是双拼韵母码;输入至少一个韵母码之后，若输入的外码不是韵母的一部分时，自动认为韵母码已经输入完毕，并将该码作为形码处理;当韵母已经结束，而输入的形码与原韵母码可以构成另一韵母时，应先输入韵母结束键“空格”，再输入形码;词组输入时，其理亦同。
全文摘要
中文归真输入法，属于一种计算机输入方法，是以词为主，以字为辅，以音定词，以词定字。采用万能提示行和动态改词法等技术，使词组输入简单、快速、扩充方便。单字编码由音、形两部分构成，音码采用改进双拼方案，形码完全回避字中的表音部分，并完全以音代形，使记忆量和重码率均接近最低限度。是一种能用电脑取代书写的输入技术。
文档编号G06F3/023GK1094171SQ9410311
公开日1994年10月26日申请日期1994年3月23日优先权日1994年3月23日
发明者叶冠卿申请人:叶冠卿

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶冠卿
技术所有人：叶冠卿
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。