无理序号数字编码法及其键盘的制作方法

文档序号:6405580阅读:309来源:国知局
专利名称:无理序号数字编码法及其键盘的制作方法
技术领域
本发明涉及到一种电子计算机汉字输入方法及键盘设计。
电子计算机汉字输入方法目前有400多种,经中国专利局公开的有100多种,这些汉字输入方法可分为四大类一、音码即根据汉字的读音来编码。如汉语拼音、声韵双拼码等。音码的缺点是重码率高、码长长,平均每字4键以上,不遵守越常用的字,击键次数越少、击键越容易的原则。
二、形码即根据汉字的字形进行编码,如《优化五笔字型编码法及其键盘》(见CN85100837A)。形码的缺点是有一套折分汉字进行编码的规则,较难学,有重码,码长较长,五笔字型的平均码长2.6键,不完全遵守越常用的字,击键次数越少,击键越容易的原则。
三、音形结合码即同时根据汉字的读音和字形进行编码,如《自然码》(汉字软件设计专家周志农。1989年6月),音形码的缺点是既要学习音码的编码规则,又要学习形码的编码规则,较难学、有重码、码长较长,每字平均击键3次以上。不遵守越常用的字,击键次数越少,击键越容易的原则。
四、数码如区位码、电报码。其缺点是码长较长,每字4键,用一般的学习方法较难掌握,不遵守越常用的字,击键次数越少,击键越容易的原则。
周志农专家在1989年6月出版的全功能第二代汉字输入软件《自然码》手册中,谈到汉字编码输入技术的发展时说纯无理序号法在我国没有出现过。此方法是按汉字出现频率,将最常用的汉字编排在最好的键盘位置上,且编码也最短。这种方法虽然记忆难度极大,但如果经过长时间熟练掌握后,从理论上说其输入速度将是最快的。
本发明的目的,在于提供一种无理序号汉字编码方案。本方案的特点无重码,码长最短,完全遵守越常用的字,击键次数越少,击键越容易的原则,有丰富的词组,容易学,容易用。
本发明包括汉字的编码方案、词组的编码方案,键盘的设计三部分具体内容。本发明用阿拉伯数字0~9、开括号阿拉伯数字(0)~(15)、闭括号阿拉伯数字 ~⑨对汉字和词组进行编码。
一、汉字的编码根据国家汉字信息处理系统工程数十名工作人员从1974年9月至1985年7月对86本书、104本期刊和7075篇论文,合计21657039个字语料的统计,将汉字根据其使用频率从大到小依次排序,将最前面的256个最常用字(使用频率达0.612)用二位开括号阿拉伯数字(0)(0)~(15)(15)编码。如(0)(0)的,(0)(1)一,(0)(2)是,(0)(3)在,(0)(4)了。将使用频率序号为257~1256的1000个常用字(使用频率为0.328)用三位闭括号阿拉伯数字 ~⑨⑨⑨编码。如 贰, ①转, ②别, ③造, ④切。以上1256个常用字的使用频率达0.940。本发明称作基本汉字编码。下列汉字的编码称作扩充汉字编码。
二键字,前一位为 ~⑨,后一位为(0)~(15),共160个汉字。
二键字,前一位为(0)~(15),后一位为 ~⑨,共160个汉字。
二键字,前一位为0~9,后一位为 ~⑨,共100个汉字。
扩充的两键字共420个,可以是用户自定义的专业常用字。也可以是频率序号1257~1676的普通常用字,使用频率为0.029,如 (0)孢, (1)勃, (2)盟, (3)买, (4)杨。
基本字和扩充二键字共1676个,使用频率为0.969。
三键字,前两位为0~9,后一位为 ~⑨,共1000个。
三键字,前二位为0~9,后一位为(0)~(15),共1600个。
三键字,前一位为0~9,后二位为(0)~(15),共2560个。
扩充的三键字共5160个,为使用频率序号为1677以后的非常用字。
基本汉字和扩充汉字的二键字共676个,三键字6160个,合计6836个,可对GB2312-80全部6763个汉字进行编码。
二、词组的编码。
本发明设计汉字-数字谐音变换表,见附图一。把所有的汉字分别归到0~9十个阿拉伯数字,对词组进行编码。词组码长四位。设基本词组3300条,扩充词组46300条。
(一)基本词组的编码。分为二字词、三字词、四字词、五字以上词。
1、二字词第一位为识别码 ,(0)或(10),第二、三位为双字词每个汉字的谐音数码00~99,第四位为 ,(0)或(10),共300条。
2、三字词第一位为识别码 ,第二至四位为三字词的谐音码数000~999,共1000条。
3、四字词第一位为识别码(0),第二至四位为四字词前三个字的谐音数码000~999,共1000条。
4、五字以上词第一位为识别码(10),第二至四位为五字以上词前三个字的谐音数码000~999,共1000条。
基本词组主要是常用的虚词,次为常用的实词。
(二)、扩充词组的编码与基本词组的编码类似,同样分为二字词、三字词、四字词、五字以上词。
1、二字词(1)、名词前一位为识别码①~⑨,中间二、三位为双字词的谐音数码00~99,第四位为识别码 -⑨。共9900条。
(2)、动词前一位为识别码(1)~(9),中间二、三位为双字词谐音数码00~99,第四位为识别码(0)~(9),共9900条。
(3)、除名词、动词以外的词前一位为识别码(11)~(15)第二三位为双字词的谐音数码00~99,第四位为识别码(10)~(15)。共3500。
2、三字词前一位为识别码①-⑨,后三位为三字词的谐音数码000~999共9000条。
3、四字词前一位为识别码(1)-(9),后三位为四字词前三个字的谐音数码000-999,共9000条。
4、五字以上词,前一为识别码(11)~(15),后三位为五字以上词前三个字的谐音数码000~999,共5000条。
扩充词组可根据不同的专业设定。识别码的编码方法是常用的词组排在前面,识别码数值小。对于二字词,先变换第一位的识别码,第四位识别码取
,(0),(10)。
本发明提出的上述编码方案,汉字和词组均无重码,基本词组和扩充词组共49600条,完全能满足各专业对词组量的一般要求。如果尚觉词组量不够,可新增词组26000条,新增词组的码长仍为四位,第一至第三位为词组的谐音数码000~999,第四位为识别码
~⑨,(0)~(15)。
本方案已实现在IBM-PC/XT及其兼容计算机上运行,在本方案输入状态下,不用任何转换可用区位码输入GB2312-80全部6763个汉字和692个图形符号。
三、键盘设计本发明将26个英文字母键盘,设计成
~⑨,(0)~(15),26个带括号的阿拉伯数字。因为本发明汉字的编码原则是越常用的字,其编码的数值越小,如(0)(0)“的”的使用频率是0.038,(9)(9)“好”的使用频率是0.002。词组识别码也是越常用的词组数值越小,所以键盘的设计,要把小数值安排在容易击键的部位,即键盘的中部。考虑到一般人右手比左手灵活,所以本发明的键盘设计如下以26个英文字母键盘Y、H、B分开,上行10个键从中到右为
、②、④、⑥、⑧从中到左为①、③、⑤、⑦、⑨。中行9个键从中到右为(0)、(2)、(4)、(6),从中到左为(1)、(3)、(5)、(7)、(9)。下行7个键从中到左为(10)、(8),从中到左为(11)、(12)、(13)、(14)、(15)。见附图2。
本发明的编码方案,在上述键盘中的规律是很明显的,例如,1.基本二键字是中行键和下行键(0)~(15)的二键组合。
2.基本三键字是上行键
~⑨的三键组合。
3.双字名词是二个上行键和二个数字键的四键组合。
4.双字动词是二个中行键及下行键的(8)和二个数字键的四键组合。
5.其它双字词二个下行键((8)除外)与二个数字键的四键组合。
6.三字词是一个上行键与三个数字键的四键组合。
7.四字词是一个中行键及下行键的(8)和三个数字键的四键组合。
8.五字以上词是一个下行键((8)除外)和三个数字键的四键组合。
本方案已在IBM-PC机上实现,发明人采用心象联想法来记忆汉字编码,记忆速度很快,每次可记住100多个汉字的编码,并且记忆深刻,不易忘记。
心象联想的基本方法是1、汉字编码的记忆将汉字的数码根据谐音表转化为一个二字词或三字词,然后把这个词语与汉字构成心象联想,并把这一联想画成图画,从而把汉字的编码记住。例的-(0)(0)领带我的领带((0)(0)转换为领带)是-(0)(2)猿人这是猿人2、词组编码的记忆根据谐音变换表将识别码转化为单词,然后将该谐音词与词组构成心象联想。例②450-(两)服务员两位服务员。
③337-(三)出租汽车三辆出租汽车。


图1、汉字数字谐音变换表。
图2、键盘图.图1中每一字包括同音字和四声。如妖、摇、舀、要;
“si”表示由该音组成的汉字,如“丝”“寺”等;“s-”表示由该音与其它音拼成的字,如“扫”“森”;
平舌音“索”包括卷舌音“说”。
本发明的优点1、本发明是以字为基础,词为主导,高频字,词优先的编码方案,并且字词库全部开放,供不同专业的用户修改字词库。它是目前最先进的汉字编码方案。正如周志农专家所说,这类编码方案是第二代的汉字输入方案。
2、本发明字、词均无重码,可以盲打。这是除了区位码、电报码等数码以外,其它编码方案所不能实现的。
3、本发明单字平均每字击键2.36次,词组平均每字击键1次,是码长的最短的汉字编码方案。
4、本发明常用字位于键盘的中部,击键容易,完全遵守越常用的字,击键的次数越少,击键越容易的原则。
5、本编码没有象形码那样的一套复杂的汉字折分原则,不用记忆字根、偏旁部首等。容易学,容易用。
6、在本方案输入状态下,可用区位码输入GB2312-80全部汉字。对大量的非常用字如扩充三键字共5087个,使用频率仅0.031。可不必编码,这样可节省计算机内存空间,因而本方案能够在内存较小的低档计算机上运行,容易推广,只需一块360K的软盘就可贮存本套编码系统,计算机内存只要有512K就可运行本编码系统。
7、运用心象联想法,能够迅速记住本方案的汉字编码和词组编码。
权利要求
1.一种汉字输入方法和键盘设计,可以利用10个阿拉伯数字键、26个英文字母键输入汉字和词组的汉字输入方法,本发明的特征是根据汉字的使用频率,按越常用的字击键次数越少、击键越容易,用二键或三键对汉字进行编码,根据词组的谐音数码对词组进行编码,在本方法输入状态下,可用区位码输入GB2312-80全部汉字和图形符号,将26个英文字母键盘设计成26个阿拉伯数字键盘。
全文摘要
一种汉字输入方法和键盘设计,利用标准键盘,可输入6763个国标一、二级汉字和75600条词组。按越常用的字、击键次数越少、击键越容易的原则对汉字编码。按词组的谐音数码对词组编码。汉字平均每字击键2.36键,词组平均每字击键1键,汉字和词组均无重码。在本方法状态下可用区位码输入GB2312-80全部汉字和图形符号,已在IBM-PC/XT及兼容计算机上实现,在内存512k,只有一个软盘驱动器的低档计算机上都可运行本方法。
文档编号G06F3/023GK1040103SQ8910707
公开日1990年2月28日 申请日期1989年9月7日 优先权日1989年9月7日
发明者肖水清 申请人:桂林市华地技术信息服务部
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1