四笔声形字词无重码输入法及键盘的制作方法

文档序号:6409028阅读:209来源:国知局

专利名称::四笔声形字词无重码输入法及键盘的制作方法四笔声形字词无重码输入法及键盘属于计算机汉字信息处理
技术领域
。汉字编码是计算机汉字信息处理工程中的一项最基础的工程。发明人从事计算机汉字编码研究已30多年,已获得两项发明专利。1986年10月19日申报的“词字二元编码输入汉字系统及键盘”发明专利(申请号86107235.9),于1990年4月18日获得中华人民共和国专利局授予的专利证书,证书号第5618号。1988年3月26日申报的“二维笔画汉字系统及综合应用键盘”发明专利(申请号88101668.3),1991年5月1日获得了中华人民共和国专利局授予的专利证书,证书号第10183号。近几年来,计算机的汉字输入技术已经解决,词组输入是提高输入速度的有效措施。可是,字库由国家标准GB2312-806763个汉字扩展到国际标准大字库ISO-1064620902个汉字;而国标通用词库由5000条增至40000多条。由于字、词的增多,字编码与词编码的重码又成了用户新的困扰。为了解决这一新的矛盾,经过数月的深入研究,终于发明了“四笔声形字词无重码输入法及键盘”。本发明是在本人已经取得专利权的“词字二元编码输入汉字系统及键盘”、“二维笔画汉字系统及综合应用键盘”两项专利和十几年应用实践的基础上研制出来的。本发明公开了一种按照汉字结构拓扑模图(见附图1)所标部位及顺序拆分并选取部件,对汉字部件采用“以声代形”的方法确定代码,即用部件名称的声母作部件的代码,利用汉字“声”、“形”两种信息,采用“四笔声形”或“四笔形声”方式编码输入的计算机汉字信息处理系统及特定键盘,其特征在于单字是通过三个影射汉字声母和部件字形信息的字母编码输入在“四笔声形”方式下,单字用本字的声母、首部件的声母、尾部件的声母三个字母编码并用空格键或符号键做结束符;在“四笔形声”方式下,单字用首部件的声母、次部件的声母、尾部件的声母(二部件合体字改用本字的声母)三个字母编码并用空格键或符号键做结束符;词组是通过四个影射汉字声母和部件字形信息的字母编码输入,不用结束符二字词组用第一个字的前两码和第二字的前两码顺序编码输入;三字词组用前两个字的第一码和第三个字的第一、二码顺序编码输入;四字以上词组用前三个字和最末一字的第一码顺序编码输入;因单字编码与词组编码所用的键元不同,所形成的码式不同,从而形成四笔声形(或四笔形声)字词无重码汉字输入系统及为实现该字词无重码输入系统而特定的键盘(见附图2)。下面是本发明的一个具体实施例一、码元设定本发明所用码元为32个。其中,26个字母键,5个符号键和1个空格键。26个字母键用于字、词编码,空格键和4个符号键用作单字输入的结束符,符号键“/”用于字、词模糊输入的“模糊输入符”,见附图2。二、关于声母用字的设定2-1关于双字母声母代码的设定普通话语系的声母21个,它们是bpmfdtnlㄅ玻攵坡冂摸匚佛ㄉ得ㄊ特ㄋ讷ㄌ勒gkhjqxㄍ哥ㄎ科ㄏ喝ㄐ基ㄑ欺希zhchshrzcsㄓ知彳蚩诗ㄖ日ㄗ资ㄘ雌思在上列“声母表”中,21个声母只有zh、ch、sh是用两个字母表示的。在汉字编码输入过程中,为减少击键次数,本发明用I、U、V分别作zh、ch、sh声母信息元的代码。2-2关于“零声母音节”声母信息用字的设定没有声母的音节,称为“零声母音节”。普通话语系共有35个“零声母音节”,即《汉语拼音方案》“韵母表”所列的35个音节,用作字头的字母只有“a、o、e、i、u”5个字母。本发明设定凡是“a、o、e”打头的音节,就分别用“A、O、E”作“声母”信息,凡是“i、ü”打头的音节,一律用“Y”作“声母”信息用,凡是“u”打头的音节,一律改用“w”作信息用。三、汉字部件与字母的影射关系本发明将汉字部件分为四类四类,即基本部件、联想部件、基本笔画、独体字。3-1基本部件本发明所谓的“基本部件”,即一般字典上的“偏旁部首”,采用“以声代形”的方法确定代码,即用部件名称的声母作部件的代码,按声母顺序排列如下B、卜(卜字形)八(八字形)丷(倒八字)勹(包字头)宀(宝盖头)贝(贝字旁)疒(病字头)白(白字旁)鼻(鼻字旁)P、冖(平宝盖)彡(撇撇撇)(字旁)丬(简旁)疋(疋字旁)皮(皮字旁)(皮字头)M、木(木字旁)马(马字旁)门(门字框)毛(毛字旁)目(目字旁)米(米字旁)母(母字旁)豸(豸字旁)矛(矛字旁)麻(麻字旁)F、扌(扶手旁)攵(反文旁)方(方字旁)父(父字旁)风(风字旁)缶(缶字旁)D、刀(刀字旁)ク(刀字形)大(大字旁)夂(冬字头)歹(歹字旁)斗(斗字旁)豆(豆字旁)T、土(土字旁)田(田字旁)N、艹(弄字底)廿(廿字头)女(女字旁)鸟(鸟字旁)牛(牛字旁)(牛字头)(牛字底)L、冫(两点水)刂(立刀旁)力(力字旁)纟(乱绞丝)立(立字旁)龙(龙字旁)耒(耒字旁)里(里字旁)卤(卤字旁)鹿(鹿字旁)G、工(工字旁)广(广字头)弓(弓字旁)巛(拐拐拐)瓜(瓜字旁)光(光字旁)艮(艮字旁)(艮字旁)革(革字旁)骨(骨字旁)鬼(鬼字旁)K、口(口字旁)H、凵(画字底)火(火字旁)户(户字头)禾(禾字旁)虍(虎字头)虎(虎字旁)黑(黑字旁)J、几(几字旁)廴(建字底)巾(巾字旁)见(见字旁)斤(斤字旁)隹(佳字形)钅(金字旁)臼(臼字旁)角(角字旁)Q、匚(区字框)犭(犬犹旁)犬(犬字旁)气(气字头)X、小(小字旁)心(心字底)忄(心竖写)血(血字旁)辛(辛字旁)I、止(止字旁)竹(竹字头)舟(舟字旁)U、厂(厂字头)车(车字旁)虫(虫字旁)臣(臣字旁)辰(辰字旁)V、十(十字旁)士(士字旁)山(山字旁)尸(尸字头)饣(食字旁)礻(示字旁)水(水字旁)手(手字旁)石(石字旁)矢(矢字旁)R、人(人字头)入(入字头)亻(立人旁)彳(双立人)(卧人旁)日(日字旁)Z、子(子字旁)辶(走之旁)自(自字旁)走(走字旁)自(自字旁)足(足字旁)c、艹(草字头)寸(寸字旁)S、厶(厶字旁)三(三字旁)氵(三点水)灬(四点底)四(四字头)(肃字头)A、衤(袄字旁)O、冂(O形框)口(O形框)(O形框)E、二(二字头)儿(儿字底)卩(耳刀旁)阝(耳刀旁)(耳刀钩)耳(耳字旁)Y、讠(言字旁)言(言字旁)又(又字旁)弋(弋字头)月(月字旁)牙(牙字旁)衣(衣字旁)雨(雨字头)酉(酉字旁)W、王(王字旁)文(文字旁)韦(韦字旁)瓦(瓦字旁)戊(戊字头)3-2联想部件本发明将在一般字典上未出现过.但在信息处理中又必须要用的部件,称为“联想部件”。为了便于记忆。就定义一个便于联想的字。再用联想字的声母作代码。在本发明中实际需要记忆的即这类部件,计51个,详列如下B、(敝字旁)P、(旁字头)M、(眉字头)F、(发字头)(丰变形)(阜字头)D、(第字底)(段左旁)T、(汤右旁)N、(牛字头)(牛字底)(囊字头)(那左旁)(鸟字头)内(内变形)L、(老字头)(郎左旁)G、(共字头)癶(癸字头)(骨字头)(官字底)K、ㄎ(亏字底)(块右旁)H、ㄏ(后字头)J、(卷字头)Q、(齐字底)(前字头)(青字头)(其字头)X、(兴字头)西(西字头)(学字头)I、(止变形)(正变形)(枕右旁)U、(春字头)(川变形)V、(手变形)Z、ナ(左字头)(载字头)C、(采字旁)(曹字头)(策字底)A、(爱字头)(哀字底)(敖左旁)0、冂(O形框)(O形框)E、彐(E变形)屮(E变形)(E变形)Y、(殷左旁)(羊字头)(羊字头)(养字头)w、亠(文字头)(无变形)(戊变形)3-3基本笔画汉字的笔画有二十多种,本系发明统归纳为八类,详见表3—1。表3-1汉字基本笔画、名称、代码一览表3-4独体字本发明对“独体字”的定义是由一个单笔画和另一单笔画或基本部件相连或相交而构成的字。在特征信息拆分编码时,拆至独体字就不再继续拆分。这里所列的独体字,是具有组字能力的独体字,就用其声母作代码,按声母顺序列出。表3-2B、不卞巴丙北比必百卑X、下习乡先囟象P、平丕I、之丈中主乍占专朱兆争重M、末民面免U、川叉尺亍斥丑出长产串丞成赤垂乘F、凡丰夫乏反非弗甫V、上勺示世申生氏术束矢戍豕D、丁旦丹东电氐单R、刃壬冉T、乇太天头屯兔Z、早再N、乜乃内农南C、才匆册L、了六乐吏令卢两良来丽隶S、卅丝肃G、干甘丐果更A、凹K、开亏E、而H、互乎亥回Y、乙于也与义幺夭玉尹央业亚以予永J、九久己井及巨今甲夹击戋柬兼堇用由亦聿曳臾禹夷Q、七千丘且曲求其W、万兀亡无五丸午乌勿为未我四、特征信息元集和键元集总表表4-1五、关于末笔形与键位的影射关系末笔笔形分为“横、直、撇、点、捺、折”六种,分别影射在四个符号键上,其对应关系是5-1“;(分号键)”影射为“一(横)”;5-2“′(小撇键)”影射为“丨(直)、丿(撇)”;5-3“,(逗号键)”影射为“、(点)、(捺)”;5-4“.(园点键)”影射为“フ(横折)、レ(竖弯折)、(竖提折)”。六、汉字拆分规则6-1独体字拆分规则“独体字”是在形体上“相对独立”的汉字的总称,实际上并不真正“绝对独立”。有的独体字是由一个基本笔画与另一独体字相连构成的,被称为“相连结构”;有的独体字是一基本笔画(或者是独体字)与另一基本笔画(或者是独体字)相交构成的,被称为“相交结构”;只具有一种结构的称为“单一结构”;同时具有几种结构者,被称为“混合结构”。对独体字采用如下几种原则拆分6-1-1单一结构的独体字,按照书写顺序,先拆出一个基本笔画或基本部件,取大优先,例如“百”属于“相连结构”,系“一(横)”与“白”相连,应拆分为“一、白”。“白”也属“相连结构”,系“丿(撇)”与“日”相连,应拆分为“丿、日”。“日”同样属于“相连结构”,系“冂”与“二”相连,应拆分为“冂、二”。“申”属于“相交结构”,系“日”与“丨”相交,应拆分为“日、丨”。“甲”属于“相交结构”,系“日”与“丨”相交,也拆分为“日、丨”。“由”还是“相交结构”,系“门”与“土”相交,应拆分为“冂、土”。“吏”属于“相交结构”,系“一(横)”与“史”相交,应拆分为“一、史”。“史”也属于“相交结构”,系“口”与“乂”相交,应拆分为“口、乂”。“出”属于相连结构,系“屮”与“凵”相连,应拆分为“屮、凵”。6-1-2对于混合结构的独体字,采取“先拆连,后拆交”的原则。例如“秉”属于“混合结构”。根据“先拆连,后拆交”的原则,应先拆出一“丿”,然后,再将所剩“相交结构”按书写顺序拆分为“一、彐、小”三个部件。(注拆至“小”就不要再继续拆分了。)“更”也属“相交结构”,先拆出一“一(横)”,再将所剩部分拆为“日”与“乂”。6-2合体字拆分规则6-2-1先上后下“安”拆分为“宀、女”;“案”拆分为“宀、女、木”。“高”拆分为“亠、口、回”;“蒿”拆分为“艹、亠、口、回”。6-2-2先左后右“别”拆分为“口、力、刂”;“捌”拆分为“扌、口、力、刂”。“刘”拆分为“文、刂”;“浏”拆分为“氵、文、刂”。6-2-3先外后内“国”拆分为“囗、玉”;“圆”拆分为“囗、口、贝”。“周”拆分为“冂、土、口”;“同”拆分为“冂、一、口”。6-2-4先中间后两边“小”拆分为“竖钩、撇、点”;“水”拆分为“竖钩、横折、捺”。“办”拆分为“力、撇、点”。6-2-5选取部件,要“取大优先”要尽可能拆出最大的、最完整的部件。例如“这”字应拆分为“文、辶”,而不要拆分为“亠、乂、辶”。“赵”字应拆分为“走、乂”,而不可拆分为“土、止、乂”。“克”字应拆分为“古、儿”,而不可拆分为“十、口、儿”。“彦”字应拆分为“产、彡”,而不可拆分为“立、丿、彡”。七、关于字、词码型及键元的设定7-1字、词最大码长为4;7-2字编码的前三位必须是字母,第四位不得使用字母。根据编码中所用字母的位数,即可区分是“字”还是“词”。由三位字母编码并用空格键或符号键做结束符者为“字”,由四位字母编码且不用结束符者为“词”。八、本发明可通过“四笔声形”和“四笔形声”两种编码输人方式实现。九、四笔声形字词无重码输人法编码规则9-1单字编码规则在“四笔声形”输入方式下,单字输入是通过三个影射汉字声、形信息的字母编码输入并用空格键或符号键做结束符实现的,其第一个字母代表本字的声母信息,后两个字母分别代表首、尾两个部件的字形信息,因而,单字输入的基本公式为“本、首、尾、空”,其中,“本”为本字的声母,“首”为首部件的字形代码,“尾”为尾部件的字形代码,“空”为空格键;一级简码为“声、空”;二级简码为“声、首、空”。9-1-1常用单字输入流程是第一码击本字的声母(屏幕显示一级高频字);第二码击首部件的声母(屏幕显示二级高频字并提示二字简码词);第三码击尾部件的声母(屏幕显示常用单字并提示三字词组、多字词组);第四码以空格键或符号键为结束符(满足条件自动输入)。常用单字输入法可简要归纳为“本、首、尾、空”四个字。常用单字编码举例见表9-1。表9-1汉字本字声母首部件尾部件特征信息元栗码仟Q亻(R)千(Q)仟亻千QRQ射V身(V)寸(C)射身寸VVC藉J艹(C)日(R)藉艹日JCR胡H古(G)月(Y)胡古月HGY茅M艹(C)矛(M)茅艹矛MCM隶L彐(E)水(V)隶彐水LEV,9-1-2单字一级简码输入法一级简码输入规则为“声、空”。一级简码共26个,按字母的顺序是“按、不、从、的、而、凡、个、和、这、就、可、了、没、年、欧、凭、且、人、所、天、处、是、我、向、有、在。9-1-3单字二级简码输入法在实际输入过程中,有620个高频字采用二级简码输入。二级简码的规则是用本字的声母、首部件的声母加空格键三键输入。简要归纳为“本首空”三个字。二级简码输入举例见表9-2。表9-2汉字本字声母首部件尾部件特征信息元二级简码李L木(M)子(Z)李木LM陈U阝(E)东(D)陈阝UE简J竹(I)日(R)简竹JI毛M丿(P)レ(L)毛丿MP王W一(H)土(T)王一WH主I、(D)王(W)主、ID9-1-4非常用字非常用字用影射末笔笔形代码的符号键做结束符。非常用单字输入规则可概括为“本首尾末”四个字。非常用单字编码举例见表9-3。表9-3汉字本字声母首部件尾部件末笔画特征信息元栗码霞X雨(Y)又(Y)乀霞雨又XYY,声V士(V)(M)丿声士VVM,娄L米(M)女(N)一娄米女LMN;筑I竹(I)凡(F)丶筑竹凡IIF,摹M艹(c)手(V)摹艹手MCV,录L彐(E)水(V)乀录彐水LEV,9-2词组编码规则9-2-1二字词组输入法9-2-1-1二字词组基本输入法“四笔声形”对于二字词采用四码输入,其基本输入流程是第一码击第一字的声母(屏幕显示一级高频字);第二码击第一字首部件的声母(屏幕显示二级高频字并提示二字简码词);第三码击第二字的声母(屏幕显示常用单字并提示三字词组、多字词组);第四码击第二字首部件的声母(满足条件自动输入)。“四笔声形”二字词的编码规则,可简要归纳为“一(一)首二(二)首”,编码举例详见表9-4。表9-4二字词第一字声母第一字首部件第二字声母第二字首部件栗码中国中(I)口(K)国(G)囗(O)IKGO北京北(B)丬(P)京(J)亠(W)BPJW科学科(K)禾(H)学(X)(X)KHXX计算计(J)讠(Y)算(S)竹(I)JYSI姓名姓(X)女(N)名(M)夕(X)XNMX性别性(X)忄(X)别(B)口(K)XXBK电脑电(D)日(R)脑(N)月(Y)DRNY9-2-1-2二字词简码输入法“四笔声形”对于二字词可采用简码输入,其简码输入流程是第一码击第一字的声母(屏幕显示一级高频字);第二码击第二码的声母(屏幕显示二级高频字并提示二字简码词)第三码击“;”键选择简码二字词。编码举例见表9-5。表9-5二字词第一字声母第二字声母二字词简码因为因(Y)为(W)YW所以所(S)以(Y)SY不但不(B)但(D)BD而且而(E)且(Q)EQ关于关(G)于(Y)GY为了为(W)了(L)WL其中其(Q)中(I)QI采用二字词简码输入法是缩短码长、提高输入速度的最佳措施。二字简码词以常用的助词、连词为主,其次是常用的名词,共573个。9-2-3三字词组输入法“四笔声形”对于三字词采用四码输入,其全码输入流程是第一码击第一字的声母(屏幕显示一级高频字);第二码击第二字的声母(屏幕显示二级高频字并提示二字简码词);第三码击第三字的声母(屏幕显示常用单字并提示三字词组、多字词组);第四码击第三字首部件的声母(满足条件自动输入)。“四笔声形”三字词的编码规则可简要归纳为“一二三(三)首”,编码举例详见表9-6。表9-6三字词第一字声母第二字声母第三字声母第三字首部件栗码可行性可(K)行(X)性(X)忄(X)KXXX北京市北(B)京(J)市(V)亠(W)BJVW科学家科(K)学(X)家(J)宀(B)KXJB计算机计(J)算(S)机(J)木(M)JSJM工程师工(G)程(U)师(V)リ(Q)GUVQ新技术新(X)技(J)术(V)木(M)XJVM联合国联(L)合(H)国(G)囗(O)LHGO9-2-4多字词组输入法本发明把四个字以上的词统称“多字词组”。“四笔声形”对于多字词亦采用四码输入,其全码输入流程是第一码击第一字的声母(屏幕显示一级高频字);第二码击第二字的声母(屏幕显示二级高频字并提示二字简码词);第三码击第三字的声母(屏幕显示常用单字并提示三字词组、多字词组);第四码击第最末一字的声母(满足条件自动输入)。“四笔声形”多字词的编码规则可简要归纳为“一二三末”,编码举例详见表9-7。表9-7多字词组第一字声母第二字声母第三字声母末一字声母栗码中国人民中(I)国(G)人(R)民(M)IGRM企业管理企(Q)业(Y)管(G)理(L)QYGL程序设计程(U)序(X)设(V)计(J)UXVJ从实际出发从(C)实(V)际(J)发(F)CVJF发展中国家发(F)展(I)中(I)家(J)FIIJ英文打字机英(Y)文(W)打(D)机(J)YWDJ中国科学院中(I)国(G)科(K)院(Y)IGKY有志者事竞成有(Y)志(I)者(I)成(U)YIIU中华人民共和国中(I)华(H)人(R)国(G)IHRG十、四笔形声字词无重码输人法在“四笔形声”输入方式下,单字输入是通过三个影射汉字形、声信息的字母编码输入并用空格键或符号键做结束符实现的,在二部件合体字中,前两个字母分别代表首、尾两个部件的字形信息,第三个字母代表本字的声母,二部件合体字输入的基本公式为“首、尾、本、空”,其中,“首”为首部件的字形代码,“尾”为尾部件的字形代码,“本”为本字的声母,“空”为空格键;在三个以上部件的合体字中三个字母分别代表首部件、次部件和尾部件的字形代码,其输入的基本公式为“首、次、尾、空”;一级简码为“首、空”;二级简码为“首、次、空”。10-1单字编码规则10-1-1独体字编码规则“四笔形声”对独体字的编码,与“四笔声形”相同,只是简码字不同。按字母顺序排列是“被、的、才、各、而、凡、个、和、中、几、口、了、面、年、向、将、且、人、法、天、厂、看、我、要、也、在”。10-1-2合体字编码规则根据汉字部件数的多少,“四笔形声”有不同的编码规则。10-1-2-1二部件汉字的四笔形声编码规则“四笔形声”对二部件合体字采用两个部件的声母及本字声母编码,其规则可简要归纳为“首尾本空”四个字。二部件汉字的简码为首尾两部件的声母,简称为“首尾”。具体输入流程是第一键击首部件的声母(屏幕显示一级高频字);第二键击尾部件的声母(屏幕显示二级高频字并提示二字简码词);第三键击本字的声母(屏幕显示常用单字并提示三字词组、多字词组);第四键常用字用空格键作结束符,非常用字追加末笔笔形代码。编码举例见表10-1。表10-1</tables>10-1-2-3多部件汉字的四笔形声编码规则“四笔形声”对于多部件汉字亦采用前两个部件和末尾一部件的声母编码,其规则可简要归纳为“首次尾空”四个字。二级简码为“首次空”。具体键入流程是第一键击首部件的声母(屏幕显示一级高频字);第二键击次部件的声母(屏幕显示二级高频字并提示二字简码词);第三键击尾部件的声母(屏幕显示常用单字并提示三字词组、多字词组);第四键常用字用空格键作结束符,非常用字追加末笔笔形代码。编码举例见表10-3。表10-310-2四笔形声词组编码规则在“四笔形声”输入方式下,词组输入是通过四个影射汉字字形信息的字母键实现的,其中,二字词组用第一个字首、次部件的字形代码、第二字的首、次部件的字形代码顺序编码输入,三字词组用前两个字的首部件和第三个字的首、次部件的字形代码顺序编码输入,四字以上词组用一、二、三和最末一个字的首部件字形代码顺序编码输入。10-2-1四笔形声二字词组编码规则“四笔形声”对于二字词组采用两个单字的前两个部件的声母顺序编码,即第一字的首部件、次部件声母和第二字的首部件、次部件声母,简要归纳为“首次首次”四个字。二字词的简码是两个首部件的声母,简要称为“首首”。具体输入流程是第一键第一字首部件的声母(屏幕显示一级高频字);第二键第一字次部件的声母(屏幕显示二级高频字并提示二字简码词);第三键第二字首部件的声母(屏幕显示常用单字并提示三字词组、多字词组);第四键第二字次部件的声母(屏幕提示同码的词组,但绝无同码单字)。“四笔形声”二字词组编码举例见表10-4。表10-4>10-2-2四笔形声三字词组编码规则“四笔形声”对于三字词组采用前两个单字的首部件的声母和第三字的首部件、次部件的声母顺序编码输入,可简要归纳为“首首首次”四个字。三字词的简码是三个首部件的声母加空格键,简要称为“首首首空”。具体输入流程是第一键第一字首部件的声母(屏幕显示一级高频字);第二键第二字首部件的声母(屏幕显示二级高频字并提示二字简码词);第三键第三字首部件的声母(屏幕显示常用单字并提示三字词组、多字词组);第四键第三字次部件的声母(屏幕提示同码的词组,但绝无同码单字;如提示的只有一个三字词,击空格键即可输入)。“四笔形声”三字词组编码举例见表10-5。表10-5<10-2-3四笔形声多字词组编码规则“四笔形声”把四字以上的词组通称为“多字词组”。“四笔形声”对于多字词组采用前三个字的首部件的声母和最末一个字的首部件的声母顺序编码输入,可简要归纳为“一二三末”四个字。具体的输入流程是第一键第一字首部件的声母(屏幕显示一级高频字);第二键第二字首部件的声母(屏幕显示二级高频字并提示二字简码词);第三键第三字首部件的声母(屏幕显示常用单字并提示三字词组、多字词组);第四键最末一字首部件的声母(屏幕提示同码的词组,但绝无同码单字)。“四笔形声”多字词组编码举例见表10-6。表10-6在原有输入法中,“筑”与“政府”、“晴、倩”与“企业”重码;在本发明中,字与词不再重码。本发明的最佳实施方案应该是将“四笔声形”与“四笔形声”两种输入方法同时置于一个系统,采用自动切换的形式,实现“四笔声形”与“四笔形声”两种输入方式智能转换;通过程序实现动态增、删词组自动存盘,并且可通过上下文智能搭配实现重码自动调换。本发明不但能在DOS系统下实现,同时可在汉化Windows上实现。权利要求1.一种按照汉字结构拓扑模图(见附图1)所标部位及顺序拆分并选取部件,对汉字部件采用“以声代形”的方法确定代码,即用部件名称的声母作部件的代码,利用汉字“声”、“形”两种信息,采用“四笔声形”或“四笔形声”方式编码输入的计算机汉字信息处理系统及特定键盘,其特征在于单字是通过三个影射汉字声母和部件字形信息的字母编码输入在“四笔声形”方式下,单字用本字的声母、首部件的声母、尾部件的声母三个字母编码并用空格键或符号键做结束符;在“四笔形声”方式下,单字用首部件的声母、次部件的声母、尾部件的声母(二部件合体字改用本字的声母)三个字母编码并用空格键或符号键做结束符;词组是通过四个影射汉字声母和部件字形信息的字母编码输入,不用结束符二字词组用第一个字的前两码和第二字的前两码顺序编码输入;三字词组用前两个字的第一码和第三个字的第一、二码顺序编码输入;四字以上词组用前三个字和最末一字的第一码顺序编码输入;因单字编码与词组编码所用的键元不同,所形成的码式不同,从而形成四笔声形(或四笔形声)字词无重码汉字输入系统及为实现该字词无重码输入系统而特定的键盘(见附图2)。2.根据权利要求1所述的汉字信息处理系统及键盘,其特征在于双字母声母zh、ch、sh分别用I、U、V作代码,“零声母音节”用其第一字母作声母信息代码。3.根据权利要求1所述的汉字信息处理系统及键盘,其特征在于将汉字部件分为基本部件、联想部件、基本笔画、独体字四类其中,基本部件是指一般字典上出现过的部件,如“艹(草字头)”、“氵(三点水)”、“疒(病字头)”等,就用约定俗成的名称的第一字的声母“C”、“S”、“B”作代码;联想部件是指在一般字典上没有出现过但在信息处理中又必需使用的部件,就先定义一个便于联想的字,再用联想字的声母作代码,如“段”字左边的部件,就用“段”字做联想字,叫做“段字旁”,就用“D”作代码,“那”字左边的部件,就用“那”字做联想字,叫做“那字旁”,就用“N”作代码;基本笔画是指“一(横)、丨(直)、丿(撇)、へ(捺)、丶(点)、フ(横折)、レ(竖弯)、(竖提)”八种笔画,分别用“H、I、P、N、D、Z、L、J”作代码;独体字是指有组字能力的独体字,就用其声母作代码。4.根据权利要求1所述的汉字信息处理系统及键盘,其特征在于可通过“四笔声形”或“四笔形声”两种编码输入方式实现。5.根据权利要求1所述的汉字信息处理系统及键盘,其特征在于在“四笔声形”输入方式下,单字输入是通过三个影射汉字声、形信息的字母编码输入并用空格键或符号键做结束符实现的,其第一个字母代表本字的声母信息,后两个字母分别代表首、尾两个部件的字形信息,因而,单字输入的基本公式为“本、首、尾、空”,其中“本”为本字的声母,“首”为首部件的字形代码,“尾”为尾部件的字形代码,“空”为空格键;一级简码为“声、空”;二级简码为“声、首、空”。6.根据权利要求1所述的汉字信息处理系统及键盘,其特征在于在“四笔形声”输入方式下,单字输入是通过三个影射汉字形、声信息的字母编码输入并用空格键或符号键做结束符实现的,在二部件合体字中,前两个字母分别代表首、尾两个部件的字形信息,第三个字母代表本字的声母,二部件合体字输入的基本公式为“首、尾、本、空”,其中,“首”为首部件的字形代码,“尾”为尾部件的字形代码,“本”为本字的声母,“空”为空格键;在三个以上部件的合体字中三个字母分别代表首部件、次部件和尾部件的字形代码,其输入的基本公式为“首、次、尾、空”;一级简码为“首、空”;二级简码为“首、次、空”。全文摘要四笔声形字词无重码输入法及键盘属于计算机汉字信息处理
技术领域
。随着国际标准大字库的出现和通用词库的日益扩大,字编码与词编码的重码又成了用户新的困扰。为了解决这一新的矛盾,在本人已获得专利权的两项专利和十几年应用实践的基础上研制出本发明。因单字编码与词组编码所用的键元不同,所形成的码式不同,从而形成四笔声形(或四笔形声)字词无重码汉字输入系统及为实现该字词无重码输入系统而特定的键盘。文档编号G06F3/023GK1127383SQ9510497公开日1996年7月24日申请日期1995年5月18日优先权日1995年5月18日发明者栗兴民申请人:栗兴民
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1