音声系列编码法及键盘的制作方法

文档序号:1513阅读:339来源:国知局
专利名称:音声系列编码法及键盘的制作方法
本发明涉及一种汉字输入方法及输入键盘,适用于计算机、打字机、通讯机及中文信息处理的其它领域。
在小键盘上进行中文信息处理,需要对汉字进行编码,但不同用户对编码方案的要求各有不同。从汉字本身特性来看,用户需求可分为以音为主的编码和以形为主的编码,音形结合码可按所使用音、形信息的多少不同归入上述二类。从方案的性能来看,用户的要求可按编码学习时间和汉字输入速度的不同分为三种一是初学者或偶然输入汉字的用户,他们把方案的易学性放在第一位,对汉字的输入速度并无苛求,编码学习时间越少越好,通常可用“分”做为计量单位,我们把针对这些用户的方案称为简易层方案。二是以输入汉字为职业的专职操作员,他们要求汉字的平均码长短,输入速度高,学习时间倒是次要的,一般可用“天”做为计量单位,我们把针对这些用户的方案称为提高层方案。三是介于这二者之间的各类用户,他们需要经常输入汉字,对编码学习时间和汉字输入速度都有所要求。一般地说,汉字输入速度应达到手写汉字速度的程度,即20字/分左右。而编码学习时间应较短,可用“小时”做为计量单位,针对这些用户的方案称为普及层方案。
目前编码方案已有数百种,以音为主的方案和以形为主的编码方案都有不少,但绝大多数编码方案属于简易层或提高层,属于普及层的方案还没查到。例如,简易层方案有“拼音一提示”(见《电子计算机动态》,1980,7),提高层方案有“WBZX”(见《中文信息处理国际研讨会论文集(2)》1983,10)。
本发明提出一种初学者或偶然用户,专职操作员及两者之间各类用户都能适用的完整编码体系。即可按简易层、普及层、提高层分为若干彼此兼容的输入方式以适应不同用户的要求,又可把各方式合为一个整体,使用户能随意改换、混用各种输入方式而不引起歧义,键盘上不必设方式转换键。由于各种输入方式相互支持,取长补短,本发明能适应最广泛的用户并且具有极高的灵活性。例如,可适用于在偶然用户、经常用户、专职操作员之间上下变化的用户。
本发明的基本构思是把汉字编码分为以音为主和以形为主的两个系列,每个系列分为简易层、普及层、提高层等,每个层次分别提供一个或多个输入方式以适应不同用户,重要的是保证本系列内各个输入方式彼此兼容、互相支持,以形成一个完整的编码体系。
本发明的基本构思已在以音为主的编码系统中(包括音码、音数码、音形码)实现。
下面是本发明的具体内容通常汉字输入系统上除键盘外,还有屏幕显示装置,可用于提示。简易层方案的基本特点是采用人机对话方式,在提示区显示若干汉字和相应代码,让用户选择所需汉字的对应代码输入。这样可免去或降低用户记忆编码的难度。而提高层方案的基本特点是尽量减少平均码长,并做到盲打。位于两者之间的普及层方案应该是大多数汉字做到盲打,而少数汉字用人机对话方式。
音声系列编码法为不定长编码,可分为字码和词组码两类,字码由音码、声调码、形码、提示码组成,下面分别说明。
1、提示码分为二种,当出现在音码中、音码后、声调码后,提示汉字及对应代码,用户需选择代码输入所需汉字,这种提示码称为提示多字码。若出现在形码后,只按频度顺序换了一个同码字,而不显示对应字符,这种提示码称为提示换字码。在本发明中提示多字码和提示换字码共用一个提示键。提示采用循环提示,当所有需提示的汉字或代码提示完后又回到起点重新提示,用户要更新提示区内容时可按一下提示键,故提示码的码长没有限制,可为0或任意自然数。
本发明的一重要特征是利用提示码在编码中出现的位置的变化以形成不同的输入方式。
当提示码完全不出现时,为提高层输入方式,用户处于盲打状态。
当提示码出现在少数汉字的形码后,为普及层输入方式,用户只需按规则码输入汉字,当少数汉字用规则码无法区分时,系统响铃或显示告诉用户需在形码后加上若干提示码,通过附加不同长度的提示码即可区分具有相同形码规则码的同音调字。
当提示码出现在音码中,音码后、声调码后,即构成不同档次的简易层方案。
为保证各档方式间容,按提示方式输入汉字时,在所输入的汉字的编码字符中去掉提示多字码得到的字符排列仍是该汉字的编码。其优点是随着实践的增多,用户会自然地逐步去掉提示符,过渡到盲打的水平。
2、形码是为了区别同音同调字提出的。编码的基本规则是取汉字尽可能大的部件的读音的声母或准声母,该部件应包含起笔或等于起笔,起笔分为5类点、横、撇、直、弯。形码除用26字母表示外,还可由6个非字母字符表示,构成32码元以增加区分同音调字的能力和便于计算机处理。非规则码取这6个非字母字符或规则码不用的其它字母。形码的码长为1。
这样选取形码的优点是规则简便易行,而且有利于适应汉字输入技术的发展。由于可在计算机内装有按上下文自动处理重码字的功能模块,多字一码的歧义问题可由计算机解决或减少,这样就不必为减少非规则码增添规则或增加码长了。
3、声调码的基本声调取四声,轻声可归入第一声,由于国标一二级字中同音字有超过32个的,但均少于64个,所以可另设四个声调键,称为辅助四声键。对于声调拿不准的用户可另设一个零声调键,作用只是作为汉字之间的区分符。这样声调码的码元可为1(零声)或4(四声)或5(四声加零声)或8(四声加辅四声)或9(四声加辅四声加零声)五种。
设立声调码的优点是即有助于区分同音字,又是汉字之间的区分字符。
4、音码的表示有4种拼音字母表示法(如新华字典所示),码长为1至6;三拼,由声、介、韵母组成,码长为1至3;双拼,由声、韵母组成,码长为2,对于无声母的韵母音节前面要加上拼音的首字母;简拼,由声、韵母构成,码长为1至2,韵母音节前不必加字母,每个单字母也可表示一个音节。拼音字母表示法的优点是国家标准,不必死记,简拼、双拼的优点是平均码长短,三拼是介于它们之间的一种折衷。
为适应最广泛的用户,本发明给出一种能包含上述四种音码表示法的统一表达形式,融合了它们的优点,使用户可以分别或混合使用这些表示法,而不必用任何状态转换键。
实现方法是先分别把声或韵母扩展或压缩为26组。新华字典中音节为400多个,声母21个,加上y、w和韵母音节的首字母a、e、o则为26个(后5个字母称为准字母)。因为i、u、v不出现在拼音字母表示法的声母中,所以可代表ch、sh、zh双字符声母,记忆方法是按字母顺序依次对应。韵母有近40个,根据不同声母后接不同韵母的规律,可用一字母表示多个韵母而不会引起歧义。这样,所有韵母都可以用26个字母或简码表示。这种表示法是不唯一的,但为了容易记忆,本发明采用下述方法,一是单字符韵母a、e、i、o、u、ü由字母a、e、i、o、u、v依次表示,字母o、v也用来表示多字符韵母的简码。二是使除a、e、i、o、u、v外的其它简码字母(即声母)至少和一个所表示的多字符韵母组成拼音的合法音节。比如x代表iang或uang,xiang是拼音的合法音节,该音节含有“想”等多个汉字,我们可从中选出一字作用联想字以帮助记忆。
确认上述四种音码表达方式混用时为哪一方式时的方法要点是根据音码的长度及字母的不同组合。例如音码码长为1是简拼,码长为2时是双拼,……。
5、词组码在一定条件下可用来加快输入速度。本发明采用汉字的声母或准声母来表示词组码。为提高词组码输入的灵活性,我们引入了替换字符和省略字符,前者可用来替换任一汉字的声母或准声母。后者相当于0至多个替换字符。为区分词组码和字码、词组和词组之间的编码,词组码还应含有词组区分符。本发明令省略字符、词组区分符、词组提示符合为一个字符。这样词组码必须包括词组中排在前面的汉字的声母或准声母或替换字符。而对应后面汉字的字符可以省略。例如若用“;”表示词组区分符,则“北京大学”不能用“bd;”表示,而需用“b;”或“bj;”或“bjd;”或“bjdx;”表示。共用同一词组码的多个词组需后面加数字或词组提示符加以区分,在这种情况下,系统响铃并显示数字及对应词组。词组的排序按词长和频度排序。具有最少汉字数中的最常用的词组不用后加数字。
本发明的词组表示法的优点是词组码定义规范,不必死记,替换字符和省略字符的引入使词组的检索和输入极为灵活方便,且在一定条件下,可使去键数少于词组含有的汉字数。
本发明的主要优点可概括为可包含以音为主的编码(音码、音数码、音形码)中各种编码方案的功能,融合它们的优点,能适应最广泛的用户,为他们提供极大的方便和高度的灵活性,并有助于初学者和其它用户顺利过渡到专职操作员的汉字输入水平。
下面是本发明的最佳实施例。
附图是适用于各种输入方式的一种键盘盘面的示意图,盘面上同一键位上单字母(即简码)和其它字母串(即声、韵母)可互相代替,为能用于标准小键盘和便于用户记忆,除声母ch、sh、zh用i、u、v依次表示外,并注意到iu=iou,un=uen,uei=ui,v=ü,uan=üan,ue=üe,则其余简码与字母串的对应关系用下列四句口诀表示。其中,双韵母对应一字母的复词形式,后一韵母前加一连字符“-”表示;句中汉字称为联想字,字母JKQV(读做街克秋威)和英文字母JKQV读音相似,称为联想字母。
白 雕 芳 草 屯 云 湾,bai diao fang cao tun -ün wan平 民 耕 作 溶 涌 涟。
ping min geng zuo rong -iong lian“J K Q V”O 蛙 吼,jie kei qiu -uei o -ua hou想 望 月 外 嫩 牙 酸。
xiang -uang yue -uai nen -ia suan由混用原则可知用户可记住上述口诀使用全部简码,也可只记住口诀中若干联想字或联想字母使用部分简码,还可不用简码。此外,简码还代表所对应的第一个韵母的读音。例如x对应的第一个韵母为iang,读音为yang,则x可表示yang的简拼形式。
下面给出音码四种表示法的例子“昂”的字母形式为ang,双拼为af,简拼和三拼为f。
“香”的字母形式为xiang,三拼为xif,双拼和简拼为xx。
“杨”的字母形式为yang,三拼和双拼为yf,简拼为x。
声调码的四声选数字1,2,3,4表示。另外,对少数几个超过32个同音调字的音调节,增设5、6、7、8作为辅四声以表示少数几个罕见字。数字O表示空声调。
形码用26个字母和数字1至6表示,起笔点、横、撇、直、弯的代码为d、h、p、v(zh)、w。例如繁的形码为m(敏),告为p(撇),意为y(音),译为6(非规则码)或y(规则码,当机器具有根据上下文选字的功能时不需附加提示换字码,没有该功能时,还应附加提示换字码以便和“意”区分)。
提示码用/表示,下面以输入汉字“堡”为例结合一些输入方式说明/的使用1、拼音提示方式。用户输入bao/或bc/,提示区显示“1c苞 1y胞 1p包……”,若没见堡字,用户还须输入/,直到“…3t堡…”出现,用户输入3t即可。
2、音调提示方式。用户输入bao3/或bc3/,提示区显示“r保 t堡…”,用户输入t即可。
3、音声码方式。(1)用户按规则码输入bao3b或bc3b,则提示区显示“宝”,并响铃通知用户还有同音调形字,用户再输入/,这时提示区显示“堡”,输入完毕。(2)用户按形码非规则码直接输入bao3t或bc3t。
4、首字母提示方式。用户输入b/,提示区显示“1埃 a芭 b白 w班 c苞…”用户输入c,以后可按前三种方式输入。
首字母方式提示单字符简拼和双拼表达式中以该字母为首音节的韵母简码及代表汉字,可帮助用户熟悉拼音或简码的表达形式。
上述四种方式中有的提示符/还可以省略。例如由系统判断键盘是否有输入字符,无则提示,有则处理该字符。
权利要求
1.一种汉字输入方法,具有基于小键盘或小键盘和提示屏幕的若干种编码输入方式,其特征在于即可按简易层、普及层、提高层分为若干彼此兼容的输入方式,以便适用于初学者或偶然用户、专职操作员以及两者之间的各类用户,又可把各方式合为一体,使用户能够随意改换、混用各输入方式而不产生歧义。
2.根据权利要求
1所述的汉字输入方法,其特征在于汉字编码分为以音为主和以形为主的两个系列,以音为主的编码由字码和词组码构成,字码由音码、声调码、形码和提示码组成,音码码长为1至6字母,声调码码长为1字符,形码码长为1字符,提示码码长为0至多个字符。
3.根据权利要求
2所述的汉字输入方法,其特征在于声调码码元在为国标一级字编码时至少为4,为国标一二级字编码时至少为8。
4.根据权利要求
2所述的汉字输入方法,其特征在于汉字的编码顺序为音码、声调码和形码,提示码在编码中的位置和作用可变,若出现在音码中或音码后或声调码后,则为提示多字码,若出现在形码后,则为提示换字码。
5.根据权利要求
1或2或4所述的汉字输入方法,其特征在于按提示方式输入汉字时,在所输入的字符中去掉提示多字码后得到的字符排列仍是该汉字的编码。
6.根据权利要求
1或2或4所述的汉字输入方法,其特征在于形码的规则码取汉字尽可能大的部件的读音的声母或准声母,该部件应包含起笔或等于起笔,用音码、声调码、形码规则码和提示换字码组成的编码至少可输入国标一级字中的所有汉字。
7.根据权利要求
1或2所述的汉字输入方法,其特征在于词组码由汉字的声母或准声母,替换字符,区分字符和数字组成,省略字符和区分字符以及词组提示字符为同一字符,替换字符或数字的码长可以为0,词组码中的声母或准声母和替换字符依次对应着词组从头往后排列的汉字。
8.一种适于上述汉字输入方法的键盘,其特征在于可同时适用于拼音字母、三拼、双拼和简拼的输入方式以及它们的混用方式,汉字的双字符声母和多字符韵母均可与它们所对应的简码字母相互代替、任意混用而不产生歧义。
9.根据权利要求
8所述的键盘,其特征是汉字的声母ch、sh、zh的简码依次为i、u、v,单字符韵母a、e、i、o、u、ü由字母a、e、i、o、u、v依次表示,o、v也用做多字符韵母的简码。
10.根据权利要求
8所述的键盘,其特征是多字符韵母的简码为除a、e、i、o、u、v的其它字母时,其简码字母至少和一个所表示的多字符韵母组成拼音的合法音节,并可在新华字典中至少找到一个属于该音节的联想字。
专利摘要
音声系列编码法及键盘。音声系列编码是一个包含简易层、普及层、提高层多种输入方式的上下全兼容汉字编码体系,具有音码、音数码、音形码诸方案的各种优点,可同时满足从初学者到专职操作员以及处于两者之间各类用户的不同需要。各种输入方式(包括目前易学性最好的方式以及快速输入的简码、词组码方式)互相支持,可任意混用。采用口诀或联想字使简码易于记忆,允许拼音、三拼、双拼、简拼的独立使用或混用。键盘上不设方式转换键。
文档编号G06F3/023GK87106019SQ87106019
公开日1988年6月1日 申请日期1987年8月28日
发明者王晓龙 申请人:王晓龙导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1