音形义字词兼容编码系统与键盘的制作方法

文档序号:6406276阅读:160来源:国知局
专利名称:音形义字词兼容编码系统与键盘的制作方法
技术领域
本发明属于汉字输入电脑的编码方法及所用键盘。
目前,我国已有上千个汉字编码方案,在电子计算机上实现的也有上百个,众多的编码方案百花齐放,各有所长,但至今仍没有任何编码方案得到人们的公认。汉字编码主要分为音码、形码、音形码、音义码、形音码等几大类。音码不需专门学习培训,只要懂得拼音,上机就可输入汉字,特别是我国在小学就开始普及汉语拼音,懂得拼音的人逐年增多,并且,拼音码不受打字方式的限制,看打、听打、想打均可。因此,拼音码具有较强的生命力。但由于以往的拼音码未解决区分同音字的问题,重码较多,输入速度较慢,只适合懂得拼音的非专业操作人员使用。字形码根据汉字字形进行编码,其优点是不受方言限制,不懂拼音的人也可使用。但由于汉字字形复杂,构件太多,规律性不强,导致字形编码的字元繁多,规则繁杂,不易掌握。音形码和音义码以拼音为基础,分别根据汉字字形或字义区分重码,音形码区分重码的效果不十分理想,音义码所用的义符太少则不够用,太多又难记忆,所以,以往的音义码也不容易找到可以两全的编码方案。形音码既用字形又用拼音,但还是未对解决编码现存问题有较大的突破。总之,现有编码普遍存在的问题就是容易学的打不快,打得快的不易学。
反映这方面的资料有1.《汉字编码方案汇编》中国汉字编码研究会编,科学技术文献出版社,1980年版。
2.《汉字编码的理论与实践》陈爱文等著,学林出版社;1986年版。
3.《中文信息》1990年第3期。
本发明的目的,在于解决汉字编码存在的一系列问题,使编码既容易学,又打得快,以便专业与非专业操作人员,懂得拼音与不懂拼音的用户,均能方便快速地输入汉字。
为什么会出现容易学的打不快,打得快的不易学的状况呢?原因就是以往的汉字编码,主要存在以下两方面的问题1.绝大多数的汉字编码方案是以单字输入为主,词组输入为辅,编码研究者的主要精力放在单字的输入上,单字的编码完成后,才考虑给词组编码,许多编码空间已被单字占用,故无法采用盲打输入常用的词组,使操作人员需要进行长期的熟悉,记下了可输入的大量词组后,才能进行正常的词组输入。如果能将常用的两万以上词组全部装入电脑,操作人员反而不需记忆,只要是常用词,就按词组输入,这样可大大地提高输入速度。现有的“双拼双音”编码,可输入上万条双音词,简单易学,输入速度较快,但该编码不足的是未区分重码,遇有重码需提示输入,许多词都不能进行盲打,减慢了输入速度,并且,未对单字进行编码,还有待进一步完善。总而言之,没有词组或可输入词组的数量太少,并未妥善处理重码词,是打不快的主要原因。
2.目前汉字编码存在的另一个问题,是屏幕提示行的显示量太小,显示的信息与编码码元脱节的问题。提示行每次只显示10个重码,同时显示出10个数字作为重码的选择输入符号,而多数编码是采用的26个字母作为编码的码元,10个数字基本上与编码无关。虽然,采用数字作为重码的选择输入符号可以避免产生二义性,但却限制提示行每次只能显示10个重码字,有的重码较多需要翻页多次才能将重码显示完。而提示行每次能显示出40个汉字的信息量,显然,提示行没有被充分利用起来,还大有潜力可挖。并且,只用数字作为选择输入符号,对编码规则的学习没有起到任何作用,使有重码的编码才能用提示的方法输入汉字,无重码或重码少的编码就无法采用提示的方法来输入汉字,白白增加了记忆编码规则的负担,导致这些编码更加难学难记,需要长期使用,死记硬背完了大量的编码规则,并熟悉了简码汉字和可输入的众多词组之后,才能进行正常的输入。
汉字编码应解决好上述两大问题,才能达到既打得快又容易学的目的。由于汉字有较强的构词能力,许多汉字都可以构成多音词,在现代汉语和人们日常使用中,有百分之八十以上是使用的多音词。单个的汉字构成多音词之后,同音现象大大减少,人们在日常的语言交往中,一般不会因同音词而影响信息的传递。如果将汉字按多音词进行编码,重码现象就会减少,在《现代汉语词典》的四万余条多音词中,同音最多的词是“shishi”,共有22个(其中有的并不常用),再根据字的声调或其它有关信息区分重码,重码就会更少,甚至可将重码率降到百分之一以下。采用词组输入不仅可减少重码,更重要的是可以提高输入速度,在码长相同的情况下,按单字输入只能得到一个字,而按词组输入可得到两个,三个甚至更多的字。这就是说,在相同的时间里,输入词组比输入单字得到的字数可成倍的增加,这一点是显而易见的。有的字不能构成词,并且使用频度也比较高,这些字可用简码进行处理,只有少量的字才用单字的方法输入,这些字因量小,不会在整体上对编码的输入速度有较大的影响。所以,只有将常用的两万多词组全部进行编码,并采取有效的措施区分重码,才能提高汉字输入速度。而单纯从单字编码的角度去考虑提高输入速度,看来是行不通的,以往产生的众多编码方案,已经说明了这个问题。
其次,提示行显示的信息应有助于编码规则的学习,使操作人员掌握了少部分编码规则,甚至不需掌握编码规则,就可上机依靠提示输入汉字。提示行显示出与汉字编码有紧密联系的信息,操作人员就可在使用中学习编码规则,而不必等到将全部编码规则学完后才上机输入汉字,这样才有利于汉字编码的使用和推广。如果将字母、数字符号标于提示行的下面,提示行可就全部用于显示汉字,而不显示选择输入重码的符号,根据所需字对应的符号,就可完成该字的输入。我在申请号为88105844的申请文件中已经提出过这个设想,事实证明是可行的,经过两年的修改,补充,现已更加完善。现在,输入汉字或其它符号,均可先在提示行显示出来,根据提示进行输入,可以大大减少学习编码规则的负担。
音形义字词兼容编码(简称音形义码),将全拼码、双拼码、音义码、音形码、字形码、两字码、多字码、简码等多种输入方法兼容,较好地解决了区分同音字、词的难题,不用切换键,既可用拼音码输入,又可用字形码输入,不仅可输入单字,还可输入词组,既适合专业人员操作,也适合非专业人员使用,可满足人们既打得快又容易学的要求。
提示符号音形义码的一个显著特点,就是将36个字母、数字排为一排,作为提示符号,固定在提示行的下面,提示行就可专门用于显示汉字。由于提示行每次可显示40个汉字,因而还剩有4个汉字的空位,可用来显示其它信息。本编码系统留出提示行最左边的4个汉字的空位,用于显示输入的符号和即将上屏的汉字,并且,凡在提示行最左边显示出的汉字,均可用空格键输入到文本区。在提示行下面的提示符号的排列情况如下
将提示符号标于提示行下面可采用多种方法,如在生产计算机显示器机壳时,就将该符号固定在上面,也可用不干胶印上36个提示符号,贴于提示行下面,或专门增加一提示行来显示36个提示符号。
全拼码全拼码按汉语拼音字母输入,双声母ch、sh、zh分别用E、U、V替代(也可不区分卷舌音与不卷舌音、前鼻音与后鼻音等),将三个较长的韵母iang、uang和iong,分别用H和Y替代。音节输入完后,击“[”键,同音字显示在提示行,可根据所需字对应的字母或数字输入汉字。汉字上屏后,可采用联想方式输入词组,同时,提示行显示出其它编码的码元,可以很方便地从中学到其它汉字输入法。
声韵双拼本汉字编码以声韵双拼作为双拼码、音形码、音义码、以及两字码的基础,声母基本按汉语拼音方案不变,将双声母ch、sh、zh分别用E、U、V代换,零声母音节用字母“O”放在音节之前代替声母,韵母用26个字母代换(见键盘图)。
双拼码基本结构声+韵+调(可输入单字6763个)使用双拼码与全拼码一样,不需专门学习培训,只要会拼音,上机就可输入汉字。在输入两码后,双拼码的重码显示在提示行,每次可显示36个同音字,它们按声调分区排列,不熟悉拼音声调的人员,可逐字依次查找,熟悉拼音声调的人员,就可直接在相应的声调区查找,可大大缩短找字时间。比如键入YI后,三十多个同音字显示在提示行,击B键,再按空格键,即可输入“一”字,如提示行没有所需字,可用“。”键向后翻页查找。一字多音的汉字可用不同拼音输入。
音义码基本结构声+韵+调+义符(可输入单字6763个)
音义码以声韵双拼作为编码基础,用声调和义符区分重码,将B、G、M、S、N分别作为阴平、阳平、上声、去声、轻声的标调代码。
义符由有特定含义的两个声母构成,一共有400多个。汉字的字义繁多、复杂,但仍可将汉字根据其字义进行分门别类。比如根据词类可分为“名词”、“动词”、“形容词”等大类,“名词”又可再分为“动物”、“植物”等中类,“动物”还可分为“飞禽”、“走兽”、“鱼类”等小类。取这些词的两个声母,就可作为有特定含义的义符,在确定一个汉字的义符时,先使用小类的义符,小类没有恰当的,就用中类的义符,最后才考虑用大类的义符。代词、副词、介词、连词、数词、叹词、象声词、语气词、助词,分别用ND、NF、NJ、NL、NU、NT、NX、NY、NV作为义符,量词用“DL”作为义符。这样,就可给任何汉字确定恰当的义符,有的汉字有多种含义,则可使用多个义符,比如“编”字有“组织”、“编排”、“制造”、“捏造”、“书籍”等含义,所以,用“ZV”(组织)、“PL”(排列)、“VZ”(制造)、“XG”(虚构)、“WJ”(文件),均可作为“编”字的义符。
由于采用了提示指导输入的方法,义符使用时不需要死记硬背,只需根据汉字的大概含义,就可照常使用。比如,要输入“沥”和“砺”两字,输入LIS之后,不知它们的义符是什么,但知道“沥”与水有关,“砾”与石有关,就可根据“水”与“石”的声母输入“U”,这时,提示行显示如下
即可根据提示,击“L”键输入“沥”字,或击“U”键输入“砾”字。
对于弄不清含义的汉字,可采用音形码输入。
音形码基本结构声+韵+调+字元1+字元2(可输入单字6763个)音形码所用声韵调与音义码相同,另采用字元区分重码。字元由大部份汉字偏旁部首构成(见键盘图),使用首字元后如无重码,该字上屏,如还有重码,再使用第二字元,第二字元可根据提示输入,比如输入YISM后,提示行显示如下
即可根据提示输入所需字,掌握规则后也可盲打输入。对于不认识的字或弄不清读音的字,以及不懂汉语拼音的人,可用字形码输入汉字。
字形码基本结构Z+Z+部首(可输入单字6763个)字元1+字元2+字元3+字元(末)(可输入单字6763个)使用字形码输入汉字最为简便,不用死记编码规则,可依靠提示输入。击两次“Z”键后,提示行显示出字形码所用的有关字元
根据提示输入与所需字有关字元对应的字母或数字,再击一结束功能键,重码字就显示在提示行,供选择输入,无对应字元的汉字,则根据该字首字元的首笔笔画和笔画数确定代码
如按ZZE,可选择输入“学”,按ZZX,可选择输入“习”。
由于字形码采用的字元来源于汉字,那么,用字元也就必然能组成汉字,为了便于人们能够很方便地记忆所用字元,本编码选用几十个汉字,每个汉字均由几个字元所组成,它们总共包含了一百多个字元,这样,人们只需记住二十几个汉字所对应的字母,就等于记住了一百多个字元应对应的字母,从而大大减轻了记忆负担。如果熟练掌握了字形码的字元,就不用提示选择,可直接快速地输入汉字。具体方法是取汉字的前面三个和最后一个字元,不足四字元的则有多少字元就取多少。如用EVZ输入“学”,用XC输入“习”。如有重码,则用汉字末笔笔画和字形结构的代码作为重码区分符,该区分符如下
字形码与全拼码一样具有联想词组和帮助学习其它编码的功能。
两字码基本结构声+韵+声+韵(可用拼音输入两字词数万条)字元1+字元2+字元1+字元2(可用字形输入两字词数万条)声+韵+声+韵+重码区分符(可用拼音输入重码两字词)字元1+字元2+字元1+字元2+重码区分符(可用字形输入重码两字词)用拼音方式输入两字词,按各字的声母和韵母取码,输入四码后,相应的两字词首字上文本区,按空格键,可将后字输入。比如键入DKND后,“电”字上屏,按空格键则“脑”字上屏。用字形方式输入两字词,按各字的一、二字元取码,输入方法与拼音方式相同,比如键入AJES后,“全”字上屏,按空格键则“部”字上屏。如相应的两字词有重码,则重码中高频词显示在提示行左端(可用空格键输入),同时,所有的重码词均在提示行显示出最后一字,显示出的字按声调(或笔画)分区排列,并按字形结构定位,根据所需词最后一字对应的提示符号,可结束该词的输入。两字码所采用的声调(或笔画)与字形交叉的重码区分符如下
比如键入YIYI后,提示行左端显示“意义”,同时,提示行中显示“一一”、“异议”、“疑义”等词组的最后一字,按“2”键,“一一”上屏,按“9”键,则是“疑义”上屏。这些两字词的重码区分符均不需死记,可根据提示输入。
这样处理后,98%以上的重码词得到了妥善解决,只剩下不到2%的重码,对于剩余重码词,采用修改功能键替换,即当一词输入文本区后,其重码在提示行中显示出来,用修改功能键可将提示行中的重码词输入文本区,同时,自动擦除原先输入的词。比如“疑义”上屏后,提示行显示“异义”、“意义”等词,按修改功能键则“异义”上屏,同时自动将“疑义”擦除。
多字码基本结构声+声+声+韵(可用拼音输入三字词数千条)字元1+字元1+字元1+字元2(可用字形输入三字词数千条)声+声+声+声(可用拼音输入三字以上词数千条)字元1+字元1+字元1+字元1(可用字形输入三字以上词数千条)用拼音方式输入三字词,按各字的声母和最后一字的韵母取码,比如“计算机”输入JSJI四键。用字形方式输入三字词,按各字的首字元和最后一字的第二字元取码,比如“新中国”输入ESTJ四键。用拼音方式输入三字以上的词,按前三字和末字的声母取码,比如“电子计算机”输入DZJJ四键。用字形方式输入三字以上词,取前三字和末字的首字元,比如“中华人民共和国”输入SMPT四键,如无重码,则该词的首字上文本区,按空格键,可将其词输入文本区。如有重码,三、四字词中的高频词在提示行左端显示,可用空格键输入,其余重码词则用词组键“;”输入,按“;”键后,多字词与二字词的全部重码均在提示行显示出来,击所需词末字对应符号的键,可将其输入文本区,也可根据需要任意选择输入,比如输入XHTU后,击“;”键,屏幕显示
这时,按“F”键可输入“新华”,按“2”键可输入“新华通讯社”。
简码基本结构声母(可输入一级高频字或词100余个)声+韵(可输入拼音二级高频字400多个)字元1+字元2(可输入字形二级高频字400多个)声+声(可输入拼音二级高频双音词300多个)输入一码后,提示行显示出相应声母的几组单字或词组,第一组是1个汉字,第二组是2个汉字,第三组是3个汉字,第四组是4个汉字……,这几组汉字分别用“空格”、“;”、“[”、“]”键……,或数字键输入,比如当输入W后,提示行显示“我”、“我们”、“为什么”、“无论如何”……,用空格键或“1”可输入“我”,用“[”键或“3”则可输入“为什么”。输入两码后,高频字或双音词显示在提示行左端,按空格键可将其输入文本区。比如键入YI,提示行左端显示“以”字,键入CM提示行左端显示“聪明”两字,均可用空格键输入。这类高频字词有1000多个,使用频率达50%以上,熟练掌握后可大大提高输入速度。
符号输入
基本结构A+数字或字母(可输入国际字符集中全部符号)按字母键A,再按一个数字或字母键,可将区位码中相应的1~15区符号调到提示行,可根据提示输入区位码1~15区的各种符号。比如键入A9后,图形符号就显示在提示行,按D键和空格键,可将“-”输入文本区,连续按“\”键,可连续输入图形符号“-”。输入字母“AO”,则可将偏旁部首调到提示行,可根据提示输入有关偏旁。
通用键盘本编码系统的键盘可采用通用的字母数字键盘,在字母键的键面标上该编码系列所用的声母、韵母和有关汉字,使用起来更为方便(见图2)。
专用键盘本编码系列还可采用专门的键盘进行汉字输入。目前流行的通用键盘是英文键盘,输入汉字时,往往左手的负担较重,不利于汉字的快速输入。专用键盘的设计充分考虑了汉字声、韵母的使用频率,结合本方案使用键盘的具体情况,并参考左右手各手指的灵活程度,对键位进行了合理安排,将26个字母和10个数字排为三横排,每排12键,左右手各分管一半,食指和中指各管两纵行,无名指和小指各管一纵行(见图3)。
本发明具有以下显著优点该编码系统简单易学,规则较少,规律性强,无论是否懂得拼音,均可输入汉字,懂得拼音的用户,不需专门学习培训,上机就可输入汉字,不懂拼音的用户,可使用字形码,根据提示输入,同样不用培训就可输入汉字。该编码系统对提示方法进行了重大改进,增大了提示量,增强了人机对话功能,提示行一次可显示36个重码字,使有重码或无重码的编码均能采用提示方法进行指导输入。单字或多音词在上屏之前,均提示出有关信息,操作人员在输入汉字时能够做到心中有数,从而大大减少了编码规则和简码汉字等的记忆量,并且,每个单字上屏后,均在提示行中显示有关编码码元,操作人员可以在使用中学习编码,初学时可以根据提示进行汉字输入,熟练后可以进行盲打输入,这就既适合非专业操作人员使用,也适合专业操作人员使用。
该编码系统具有较高的输入速度,将简码、全拼码、双拼码、音义码、音形码,字形码、两字码、多字码等多种输入方法融为一体,不用切换功能键,就可任意采用某种方法输入单字或词组。该编码系统以词组输入为主,用简码、两字码、多字码等可输入词组两万条以上,并辅以单字输入,用简码、全拼码、双拼码、音形码、音义码、字形码、两字码、多字码均可输入单字,还可很方便地输入600多个图形符号、外文字母和数字符号等,较好地解决了长期存在的区分同音字、词的难题,单字重码较少,词组的重码率不到1%,平均码长不足两码,如进行盲打,每分钟可输入汉字200个以上。
该编码系统还具有广泛的用途,由于任何汉字进入文本区后,该汉字的字音、字义均在提示行中显示出来,故该编码系统还具有学习汉字的功能,可用来作为字典使用,并可大大提高查字典的速度。此外,该编码系统还可用于编排字典、电报通讯等,有利于在全国推广普及汉语拼音和普通话,还可为我国实现汉字拼音化创造条件。
音形义字词兼容编码系统已在电子计算机上实现,能支持CCDOS2.10以上版本,可在IBMPC机以及长城系列微机上运行。
音形义码的附表和附图如下表1音义码义符表

图1标有提示符号的电脑显示器图2通用键盘图3专用键盘
权利要求
1.一种用于计算机的汉字编码系统,将全拼码、双拼码、音义码、音形码、字形码、两字码、多字码、简码等多种输入方法融为一体,采用通、专用键盘进行汉字输入,其特征在于双拼码、音义码、音形码、两字码采用声韵双拼为基础,声母基本按照《汉语拼音方案》不变,将ch、sh、zh分别用E、U、V代换,零声母用“O”表示;将26个字母和10个数字作为提示符号标于提示下面;双拼码用声、韵、调输入,输入两码后,36个同音字显示在提示行,按声调分区排列;音义码用声、韵、调、义符输入汉字,义符由特定词的两个声母构成;音形码用声、韵、调、字元输入汉字,字元由大部份偏旁部首组成;字形码用字元输入汉字,字元由大部份偏旁部首组成,这些字元可构成几十个汉字,每个汉字对应一个字母或数字,两字码用少数字母和十个数字作为声调、笔画与字形结构的交叉信息代码来区分重码;图形符号、外文字母、制表符号、偏旁部首用字母“A”加一个数字或字母输入。
2.根据权利要求1所述的汉字编码系统,其特征在于提示符号可在生产计算机显示器机壳时就固定在上面。
3.根据权利要求1所述的汉字编码系统,其特征在于提示符号也可用不干胶贴于提示行下面。
4.根据权利要求1所述的汉字编码系统,其特征在于提示符号也可专门用一提示行来显示。
5.根据权利要求1或2或3或4所述的汉字编码系统,其特征在于标于提示行下面提示符号的排列顺序为B、C、E、D、F、A、1、2、G、H、J、K、L、I、3、4、M、P、Q、R、O、5、6、S、U、T、W、X、Y、Z、V、7、8、9、N、0。
6.根据权利要求1所述的汉字编码系统,其特征在于拼音类编码所用提示符号表示声调的情况是用B、C、E、D、F、A、1、2表示阴平,G、H、J、K、L、I、3、4表示阳平,M、P、Q、R、O、5、6表示上声,S、U、T、W、X、Y、Z、V、7、8、9表示去声,N、0表示轻声。
7.根据权利要求1所述的汉字编码系统,其特征在于字形类编码所用的笔画与字形结构交叉信息代码用B、C、E表示“点”笔,H、J、K、表示“横”笔,P、.Q、R表示“撇”笔,U、T、W表示“竖”笔,X、Y、Z表示“折”笔,同时,用B、H、P、U、X表示左右字形结构,C、J、Q、T、Y表示上下字形结构,E、K、R、W、Z表示其余字形结构。
8.根据权利要求1所述的汉字编码系统,其特征在于两字码的重码区分符用A、1、2表示阴平和“点”笔,I、3、4表示阳平和“横”笔,O、5、6表示上声和“撇”笔,7、8、9表示去声和“竖”、“折”笔,同时用A、I、O、7表示左右字形结构,1、3、5、8表示上下字形结构,2、4、6、9表示其它字形结构。
9.根据权利要求1所述的汉字编码系统,其特征在于通用键盘各键所安排的声母、韵母和汉字如下上排从左到右排列的顺序为Q-er、ie鳅;W-ei、峰;E-ch、e、辛;R-en、鹞;T-eng、跖;Y-ong、iong、缥;U-sh、u、瞵;I-i、芹;O-o、uo、胸;P-ou、篑;中排从左到右排列的顺序为A-a、诶;S-ai、叻;D-ao、悯;F-an、汀;G-ang、材;H-iang、uang、塄;J-ia、ua、珀;K-ian、匦;L-iao、拥;下排从左到右排列顺序为Z-un、un、好;X-uai、u、骟;C-uan、uan、裱;V-zh、ui、ue、陀;B-iu、疫;N-ing、钱;M-in、倪。
10.根据权利要求1所述的汉字编码系统,其特征在于专用键盘各键所安排的声母、韵母和汉字以及数字、标点符号如下第一排从左到右排列顺序为N-ei、钱;1-灬;2-心;3-页;4-过;5-攵;6-欠;7-刂;8-见;9-卩;0-糸;V-zh、iang、uang、陀;第二排从左到右排列顺序为F-eng、汀;D-en、悯;E-ch、e辛;C-ang、裱;B-an、疫;A-a、诶;I-i、芹;G-ai、材;H-ao、塄;J-iao、er、珀;K-ian、匦;L-ia、ua、拥;第三排从左到右排列顺序为R-un、un、鹞;Q-uai、u、鳅;P-uan、uan、篑;M-ui、ue、倪;O-o、uo、胸;S-ou、叻;U-sh、u、膦;T-iu、跖;W-iong、ong、峰;X-in、骟;Y-in、缥;Z-ie、好;第四排从左到右排列顺序为!-〔;;-〕;·-《;、-》;空格键;,-“;。-”;-(;?-)。
全文摘要
一种用于电脑的汉字编码系统,不用切换功能键,就可任意用简码、全拼码、双拼码、音义码、音形码、字形码、两字码、多字码等方法输入汉字、以词组输入为主,辅以多种单字输入,可输入单字6763个和词组两万以上,还可输入各种图形等符号,较好地解决了区分同音字、词的难题,解决了易学与快速的矛循,任何人不用学习规则,上机就可根据提示输入汉字,熟练后可进行盲打,每分钟可输入汉字200个以上,该编码系统已在电脑上实现。
文档编号G06F3/023GK1068203SQ9110440
公开日1993年1月20日 申请日期1991年6月23日 优先权日1991年6月23日
发明者李一新 申请人:李一新
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1