键盘输入汉字二代区位码的制作方法

文档序号:6408098阅读:415来源:国知局
专利名称:键盘输入汉字二代区位码的制作方法
技术领域
本发明属电子计算机键盘输入汉字编码技术。电子计算机汉字输入技术领域,有三种发展方向键盘输入,手写输入,声控输入。键盘输入已进入实用阶段,该类输入方法除大键盘输入外,都必须把汉字编码。基本的编码方式有三类区位码、音码、形码。在此基础上发展起来的属“复合码”类,如音形码。本发明也是一种“复合码”,由区位码和音码复合而成,实质上还是一种区位码。其目的在于解决音码输入的重码,克服形码输入的难学,提高音形码输入的速度。
本发明把所有的汉字分成2035个区,区名即是这个区汉字的读音;区里的汉字或其它字符被分放在用a,b,c…;A,B,C…等编上序号的小区内,小区的编号称之为位名。“区名+位名”对应于一个确定的汉字,或其它字符,文件。
区名,用于汉字区名编写的拉丁字母共407组,每组对应于一个音节,见说明书附

图1中打星号的方格。每一个方格进一步被分成五个区,每个区对应于一个同音字集,某些区对应的可以是空集。见说明书附图3。编码声韵母与汉语拼音方案的对应关系见说明书附图2。零声母区名的编写见说明书附图4,非零声母区名的编写见附图5。
位名,位名根据需要分别用小写的a,b,c…其中不含v;大写的A,B,C…其中不含Z;小写带撇号的a′,b′,c′…;大写带撇号的A′,B′,C′…来编写,容量为102。超过过个容量的用01,02,03…等两位阿拉伯数字来编写。小写字母v用作轻声的调号;大写字母Z用来编写“区位元素咨询码”,该码用以显示某区的全部元素。如RiZ键入后,“日”所在区的全部元素便出现在显示屏上。本发明,常用字的位名以黄伯荣、廖序东主编的《现代汉语》上册,1983年6月第3版,第131—159页上的常用同韵字表的排序为准;次常用字的位名,以《新华字典》1993年7月第8版去掉常用字后,按字典顺序接着常用字往后排。本发明的位名,在编程时必须与GB2312—80汉字字符集的“位码”进行转换。如“的”的位名有两个,即轻声和阳平声的c,以及去声的h,都应换成36。
“区名+位名”并非形式地对应于一个汉字,它是以非空的同音字集和非空的同序字集的交,这种运算为依据的。在本发明里,计算结果只要为非空集,它就仅有一个元素,也即没有重码。参见说明书附图6。
五八年公布的汉语拼音方案定义在22×38的方阵上,优点是利于音素分析,但实践证明不利于汉字输入。本发明将其压缩到26×26的方阵上,克服了这一缺点。加之给汉字注音的功能不变,且有所发展,两个字母(轻声字为三个)就把汉字的声韵调全都表现出来!如把本发明的区名做为汉语拼音方案的代用系统,用于拼音教学,则汉字输入对于小学生来说,就成为不学而能的事。
本发明成功地解决了声调输入技术,极大地提高了输入精度。区名单位码长的信息容量为双拼双音的1.5倍,输入速度的提高是其必然结果。
本发明采用两种方式输入汉字一种是区名、位名都打的全息输入;一种是只打区名,然后选字、选词的半息输入。
全息输入只要把本发明的区名,转译成内存汉字库的区码;位名转译成内存汉字库的位码即可。如“日”的区名是Ri,区码是40;位名是a,位码是53。当键入Ria时,计算机立即将其转译成4053,便输入了这个字。相似地,可用这种编码输入其它图形符号。参见说明书附图7。
半息输入根据对汉语词汇的分布统计和语言的分化规律,对单音节词和双音节词输入区名;三字及三字以上词语,只输入前三个字的声母(大小写应表现出来)外加语词的字数。如“giY5”表示“国家语工委”,而“giY11”则表示“国家语言文字工作委员会”。这种三个拉丁字母带阿拉伯数字的结构,可称为语汇预制块。它能雪崩式地提高输入速度。参见说明书附图8。
图面说明本发明图表共八幅,前六幅有关编码的技术细节和示例;后两幅有关全息输入和半息输入的计算机流程。
图1压缩的汉语拼音方案定义空间纵向字母表示声母,其中小写字母v有特殊用途;横向字母表示韵母。本发明以位置区别声韵母。打星号的方格共407个,对应于现代汉语的407个音节。
图2编码声韵母与汉语拼音方案的对应关系形式上,本发明有25个声母,其中有4个零声母;26个韵母,其中有11个双重或多重韵母。实质上,它和汉语拼音方案是完全对应的。
零声母在拼写时不读音,通常情况下读字母表中的音;双重或多重韵母,依照它和声母的关联进行区分,不会发生混淆。
图3音节的五个区本发明以拉打字母大小写的不同组合表示声调,即声韵母都小写表阴平声;声母小写,韵母大写表阳平声;声韵母都大写表示上声;声母大写,韵母小写表示去声;阴平声加小写字母v表示轻声。
图4区名零声母音节与汉语拼音方案的对应关系本发明零声母的作用是补位、区分后随韵母的类别和以其大小写表示声调。
图5区名部分非零声母音节与汉语拼音方案的对应关系注意,本发明的11个双重或多重韵母会因其与不同的声母相拼,而表示不同的韵母。如jb中的b表示ia;而hb中的b则表示ua。教学中可以“整体认读音节”加以处理。
图6部分汉字的全息码示例全息码的码长为3(轻声字为4),前两个字母表示汉字的音,后一个字母表示汉字在同音字集中的位置。全息码即“区名+位名”。
把本发明用做拼音文字时,应分字连写。
图7全息输入流程中字母N,Y表示判断。NNO不;YYes是。其余字母表示程序A起动B进入DOS状态C键入的是拉丁字母吗?若不,程序进入I不记位G打印H结束若是,程序进入D记位E第二次键入的字母能和前面的字母相拼吗?若不,程序进入G,H。此时打开的是汉语拼音方案定义的剩余空间编制的“锦囊码”。若还有用这两个字母开头的文件,此时应打空格键,文件才能打开。如BE做文件名时应补打空格键;EB3做文件名时,应打阿拉伯数字3。
若是,程序进入F第三次键入的是拉丁字母码?若不,这时只可能是阿拉伯数字,出现的是罕用字,或其它字符。
若是,则有四种可能一种是非轻声字;一种是轻声字,若同一区中位名不止一个待补码打出;一种是区位元素咨询码;还有一种是以定义汉字剩余空间做名的文件。
最后,程序进入G,H。
图8半息输入流程中字母N,Y表示判断。NNO不;YYes是。其余字母表示程序。
注一、半息输入有三种语义单位需要处理1.单音节词;2.双音节词;3.语汇预制块。
二、半息输入有两种需要打开的文件1.锦囊码;2.区位咨询码。
三、半息输入以标点符号和空格键为节,以三种语义单位为拍。所谓节拍,乃计算机就输入信息给出应答的周期。
***A起动B进入DOS状态C键入的是拉丁字母吗?若不程序进入M不记位K打印L结束若是,程序进入D记位E第三次键入的是小写字母v吗?此处,计算机把轻声字(音节)辨认出来。若不,程序进入F第三次键入的字母有可能和前面两个字母构成双音节词吗?若是,程序进入G第四次键入的是阿拉伯数字吗?此处,计算机把“预制块”辩认出来。若是,程序进入K,L若不,程序进入H第五次键入的是拉丁字母吗?若不,则有两种情况,一种是四个字母表示的是双音节词,另一种是四个字母表示的是两个单音节词。无论何种情况都进入K,L。若是,程序进入
I第六次键入的是拉丁字母吗?若不,则此时只有一种可能,即第六次键入的是阿拉伯数字,后三个拉丁字母和阿拉伯数字构成“预制块”,前两个字母是一单音节词。
若是,则有三种可能1.前四个字母是一双音节词;2.后四个字母是一双音节词;3.前四个字母是两个单音节词,后一个尚不能确定。1、3两种情况,尚有一余量,即剩两上字母回到E,其余的进入K,L。
若不,程序进入(回到F→J)J第四次键入的是阿拉伯数字吗?若是,则为一“预制块”,进入K,L若不,打空格键了吗?此时能把区位咨询码打开。若再不,则前两个字母是一单音节词,剩余进入E,其余的进入K,L。至于锦囊码,D→E的过程中,打空格键,锦囊打开。
因此,咨询码和锦囊码的打开环境是这样的记位处于0的状态,然后再在咨询码和锦囊码后打空格键。
***补充说明锦囊码有两种,一种是汉语拼音方案定义的剩余空间编制的,信息特征是两个字母不能相拼;另一种是汉字定义的剩余空间编制的,信息特征是,该位上没有汉字或其它字符。因它们便于识别,常用来作文件名。若文件是一高频字符集,比如“之、乎、者、也…”等文言虚词,通常以对应的方式,用暂时闲置不用的数字小键盘区编码,一次击键便可输入一文言虚词。
半息输入的选字,选词必须在打过标点符号或空格键之后,即记位处于0的状态。
权利要求
1.编码由区位码和音码复合而成,保留了区位码无重码的优点,克服了其难记的缺点。
2.遵循多就少改的原则,对汉语拼音方案加以改造,使其声韵母各用一个字母表示。声韵母编写字母的位置、大小写、关联都载含有效信息,成功地解决了声调输入技术,并使码长最大限度地缩短。还可用以代替汉语拼音方案进行拼音教学,做拼音文字等。
3.采用两种输入方法全息输入能处理各种复杂语境,半息输入最大限度地提高了输入速度。
4.汉语拼音方案定义空间和剩余空间,全息码汉字定义空间和剩余空间界线分明。将它们的剩余空间用来编写文件名,可以在汉字输入过程中,随时打开文件。
5.除输入汉字外,还可输入其它图形、符号。申请人就上述5项,请求予以保护。凡有下列情形之一的都被视为侵权行为1、未经专利权人许可,直接以本发明提供的技术,生产电子计算机线路板,软件,识字拼音积木,麻将牌等。2、未经专利权人许可,变相实施本发明专利。如调整几个声韵母,把阳平和上声的表示方式对换等。3、未经专利权人许可,部分利用本发明的技术对其产品进行改造,使其更新换代。如用本发明的声调输入技术改造双拼双音,提高输入精度等。4、未经专利权人许可,使用本发明提供的下述方法,即在汉字输入过程中打开用数字小键盘区编码的高频字符文件等。
全文摘要
键盘输入汉字二代区位码,属电子计算机键盘输入汉字编码技术,主要用于汉字编码,也可为内存的其它图形符号编码,在输入汉字的过程中,可随时插入所需图形符号。主要技术特征如下,单位码长信息含量大,输入精度高。码长为三时能容下所有的汉字和数以千计的图形符号。本发明除用于输入汉字、图形、符号外,还可用于拼音教学,做拼音文字等。
文档编号G06F3/023GK1129825SQ9411555
公开日1996年8月28日 申请日期1994年9月2日 优先权日1994年9月2日
发明者舒从如 申请人:舒从如
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1