专利名称:文字式音形汉字输入方法
技术领域:
本发明涉及一种以字音为主、字形为辅用键盘字母对汉语字词进行编码输入的文字式音形汉字编码输入方法。
众所周知,汉字的键盘输入要比任何一种拼音文字更为困难。尽管国内外已有数百种汉字编码键盘输入方法,但还没有一种既具有易学性和快速性,又具有正音性和文字性的中文字词编码键盘输入方法。如周志农先生的“自然码”(北京经济学院出版社《中国微机办公自动化软件大全》),它虽然较好地解决了快速性和易学性的统一问题,但由于它不能表示声调,所采用的拼音没有突破传统的双拼模式,形码部分也没有冲破传统的字根模式,因而仍存在记忆负担重,输入速度不理想和语音表达不全面的缺陷。唐懋宽先生的“声数码”(北京经济学院出版社《中国微机办公自动化软件大全》)用j、x、v、h表示阴、阳、上、去四声,与表示声母和韵母的字母有冲突,且声调键不能兼具选择同码的功能,因此它不具备文字性且输入速度不理想。
本发明的目的是提供一种既具有易学性和快速性,又具有正音性和文字性的文字式音形汉字输入方法。
本发明的目的是采用字母键盘结合编码规则和输入方法来实现的。其具体编码规则和输入方法是用u、v、w分别代表声母的zh、ch、sh,其它声母与键盘字母相同;用与表示声母相同的21个字母结合字母y表示韵母;用a、e、i、o表示阴、阳、上、去四声和选择同码;声韵相拼,遇零声母音则加y,否则不加y,便得到“音”;用“二分成形法”拆字为两个部件,合并两部件“音”的首字母得字的“形”;单字的编码为字“音”加字“形”;双字词的编码为第一字“音”加第二字“音”;叁字词的编码为第一、二字“音”首字母加第三字“音”;肆字及肆字以上词的编码为第一、二、三、末字“音”首字母的组合。
下面结合表和实施例对本发明进一步说明。
表1是本发明声母、韵母和声调与键盘字母的对应关系表;表2是本发明的键位;表3是本发明的非成字部件表;在表1中,用u、v、w分别代表声母的zh、ch、sh三个复声母,其它声母与键盘字母相同;把韵母按互补原则归并为2类,并用与表示声母相同的21个字母结合字母y来表示,后面加y的为+y韵母,首面加y的为y+韵母;声韵相拼时,对于非零声母音则不加y,对于零声母音则加y。因此,任何字的“音”都由上述22个字母中的两个拼成。节约的a、e、i、o四个字母,正好用来表示阴(-)、阳( )、上( )、去( )四个声调,也可兼做选择键。
在表2中,键上的大写字母表示键名;键上的三排小写字母表示为该键分配的声母和韵母;Y键上的+y和y+表示在拼写零声母音时与+y同排的韵母应在后面加y,与y+同排的韵母应在前面加y;A,E,I,O键上分配的是阴(-)、阳( )、上( )、去( )四声;由于汉语的声调具有区别意义的作用,因此汉语拼音文字必须标调,而且标调必须用职能化的字母。若用其它方法标调,就会使其不象一种文字。本发明能做到这一点,故形如文字,称它为“文字式音形汉字输入方法”。
例如妈、麻、马、骂四个字,从圈1或图2可知,声母为m,韵母为去掉y的b,其“音”都拼为mb,而其“带调音”则分别拼为mba、mbe、mbi、mbo。又如师、实、使、视四个字,其“音”都拼为wm,面其“带调音”则分别拼为wma、wme、wmi、wmo。
本发明对字形编码采用“二分式成形法”进行拆字,所拆部件构成字的,其“音”为该字的“音”,所拆部件为非成字的,其“音”按“非成字部件表”中规定的音。
“二分式成形法”是将字拆分为前后两个部分,尽量使它们是较优先的部件;若某部分不是部件,则对该部分继续拆分并提取较优先的部件,合并所得两个部件“音”的首字母便得该字的“形”。
详细地讲,“二分式成形法”由以下三个步骤组成1.二分拆字,即将汉字拆分为前后两个部分,拆分的结果有下面4种情况(1)前后两部分都是部件;(2)前部分是部件,后部分不是部件;(3)后部分是部件,前部分不是部件;(4)前后两个部分都不是部件。
2.提取部件,即对非部件部分继续拆分并提取优先级别高的部件代表该部分本身。在此过程后,前后两部分都成了部件,分别叫前部件和后部件。
3.合并音首,即“形”=前部件“音”的首字母+后部件“音”的首字母。
部分的前后是按先上后下、先左后右、先外后内、先横后竖的原则确定的。
部件分为三级,一级部件是用作构字的成字,其“音”就是该成字的音;二级部件是在“非成字部件表”(表3)中的非笔划部件,其“音”在表中规定;三级部件是在“非成字部件表”(表3)中的笔划部件,其“音”也在表中规定。
部件的优先级别是这样规定的一级部件级别最高,二级部件次之,三级部件再次之;同级别的部件则笔画多的优先,笔画也相同的则按先上后下、先左后右、后外后内、先横后竖的原则确定优先级别。
本发明单字和词组的完全编码都是等长的四元码,即每个完全编码都由四个码元组成。单字的编码就是字“音”加字“形”。在词组的完全编码中,双字词的编码为第一字“音”加第二字“音”,叁字词的编码为第一、二字“音”首字母加第三字“音”,肆字及以上(含肆字)词的编码为第一、二、三、末字“音”首字母的组合。但在实际输入过程中,字词所用的输入码是不等长的。本发明按照高频优先的原则,为使用频率越高的字词分配码长越短的输入码。输入码分为一级码、二级码、三级码和四级码,分别取相应完全编码的前一、二、三、四个码元构成。四级码的第四码元要用大写字母输入。
如“人”字的完全编码为rgpn,但其输入码为r;“算”字的完全编码为szum,但其输入码为sz;“计”字的完全编码为jmxw,但其输入码为jmx;而“腴”字的完全编码为yuyy,其输入码是yuyY。“计算”的编码为jmsz;“计算机”的编码为jsjm;“社会主义”的编码为whum;“中国共产党”的编码为uggd。
本发明用a、e、i、o选择同码字词,并且可同时表达字的声调。
例如“妈”、“麻”、“马”、“骂”四个字输入码都是mb,用a、e、i、o键选取,且与所选字的声调相吻合,即表阴平的a选阴平字“妈”,表阳平的e选阳平字“麻”,上声的i选上声字“马”,去声的o选去声字“骂”。
本发明采用了多种自动选择技术来加快输入速度。本发明将自动选择技术分为“续码自选”、“续符自选”和“三元自选”三种。“续码自选”技术就是在输完完全编码后,若继续输入码元键,则自动选择第一同码字词。“续符自选”技术就是在已经输入1~4个码元时,若输入非码元、非选择键的图形字符键,将自动选择第一同码字词。“三元自选”技术就是,对于完全编码为四元的编码输入法,在输入三个码元后,若再以小写输入码元键将自动选择第一同码字词,且所输入的码元被作为下一输入码的第一码元。若要输入第四码元则须用大写字母。由于常用字词都尽量分配有较短的输入码,因此在实际输入过程中需要输入第四码元的字词是很少的。“续码自选”是几乎所有的汉字编码输入法都已采用的技术。“续符自选”和“三元自选”则是本发明的技术创新。
例如在输完jmx三个字母后,第一同码字为“计”,若再输入小写字母,“计”字将被选中,输入的小写字母将被作为下一输入码的第一码元,不象现有输入法那样需用空格键选取。若要输入“悸”字(其输入码为jmxJ),则在输完jmx三个字母后,要用大写字母输入第四码元(即J)。若输完jmx三个字母后,再接着输入句号(即“。”号)时,“计”字也将被自动选择,不再需要空格键。
本发明由于“三元自选”技术的采用,使得三级输入码变成了一种很特别的码位。本发明的三级码码位有22×22×22=10648个,也即本发明有10648个特征码位。尽管中文字词数有数十上百万个,但对于每一个特定的输入环境,其所用的字词一般都在数千个左右。这就是特征码位技术赖以成立的基础。特征码位技术是这样实现的编码输入系统提供特征码位的初始值(初始值为通用的常见字词),用户输入的每一个大于三个码元的字调将对其所包含的特征码位重新赋值,从而使特征码位上的字词随用户的输入环境而发生适应性的动态变化。变化后的特征码字词还可存盘后供用户在类似的输入环境中重复使用。
例如在输入中医文献时经常用到“悸”字, 在第一次输入该字时需用四个码元jmxJ,在下次输入该字时,就只需用前三个码元了,即这时输入码jmx上的字变成了“悸”,而不是原来的“计”。此时,“计”字的输入码则变成了jmxW。
与现有技术相比,本发明具有下述优点①采用文字式拼音,声调用字母表示,具有很强的正音性和文字性;其拼式简洁,信息容量大,汉语语音表达全面,规则简单。②本发明的“二分式成形法”从绝大部分现代汉字都是形声字这一客观事实出发,直观自然地拆分字形,符合人们分析汉字的习惯,具有较强的单一性。③用A、E、I、O键选择同码且兼表字的声调,使选择同码具有了有理性,便于学习和记忆,同时由于选择键为字母键,因而比用数字键易于盲打。④本发明通过“三元自选”和“特征码位”技术的结合使用起到了“四元编码,三键输入”的效果,一般字词的输入均只需三键,极大地提高了输入速度。采用“续符自选”技术使得常用符号的输入兼具了选择的功能,进一步加快了输入速度。
权利要求
1.一种文字式音形汉字输入方法,包括编码方法及字母键盘,其特征是①用u、v、w分别代表声母的zh、ch、sh,其它声母与键盘字母相同;②用与表示声母相同的21个字母结合字母y表示韵母;③用a、e、i、o表示阴、阳、上、去四声和选择同码;④声韵相拼,遇零声母音则加y,否则不加y,便得到“音”;⑤用“二分成形法”拆字为两个部件,合并两部件“音”的首字母得字的“形”;⑥单字的编码为字“音”加字“形”;⑦双字词的编码为第一字“音”加第二字“音”;⑧叁字词的编码为第一、二字“音”首字母加第三字“音”;⑨肆字及肆字以上词的编码为第一、二、三、末字“音”首字母的组合。
2.根据权利要求1所述的文字式音形汉字输入方法,其特征在于声母、韵母、声调与键盘字母的对应关系如下 (接上表)
3.根据权利要求所述的文字式音形汉字输入方法,其特征在于“二分式成形法”所拆部件构成字的,其“音”即为该字的音;所拆部件为非成字的,其“音”按如下“非成字部件表”规定的音非成字部件表
4.根据权利要求1所述的文字式音形汉字输入方法,其特征在于字词的输入码分为一级码、二级码、三级码和四级码,分别取相应完全编码的前一、二、三、四个码元构成。
5.根据权利要求4所述的文字式音形汉字输入方法,其特征在于输入三个码元后,若再以小写字母输入码元键则将自动选择第一位的同码字词。
6.根据权利要求4所述的文字式音形汉字输入方法,其特征在于四级码的第四码元要用大写字母输入。
7.根据权利要求4所述的文字式音形汉字输入方法,其特征在于在已经输入(1-4个)码元时,若输入非码元、非选择键的图形字符键,将自动选择第一同码字词。
全文摘要
本发明是一种文字式音形汉字输入方法,其特征是用u、v、w代表声母zh、ch、sh,其它声母与键盘字母相同;用与声母相同的21个字母结合字母y表示韵母,声韵相拼便得“音”;用a、e、i、o表示声调和选择同码;将字拆为两个部件,合并其“音”的首字母得字“形”。字的编码为字“音”加字“形”,词组的编码由字码派生而来。本发明特有的“三元自选”、“特征码位”和“续符自选”技术可加速输入。它不仅具有易学性和快速性,还同时具有正音性和文字性。
文档编号G06F3/023GK1148196SQ95111380
公开日1997年4月23日 申请日期1995年5月26日 优先权日1995年5月26日
发明者戴石灵 申请人:戴石灵