汉字笔形数码输入方法

文档序号:6573112阅读:420来源:国知局
专利名称:汉字笔形数码输入方法
技术领域
本发明属于汉字计算机输入技术领域,具体涉及一种以汉字的笔画为基础,将其转化为数字输入计算机的汉字笔形数码输入方法。
现有的汉字编码输入方法中,王永民的“五笔字型输入法”因其相对于其它各类输入方法较简单,易记,所以使用最为普遍。但是,“五笔字型输入法”以其归纳的五大类字根共130为基础,形式复杂多样,规律性不强,必须死记,字根的量相对较多,还不是一种简单、快捷的输入方法。
本发明目的在于针对现有汉字计算机输入技术存在的不足,提供一种以汉字的笔画为基础,将其有规律地转化成为数字,以达到简单、快捷的计算机输入目的的汉字笔形数码输入方法。
本发明的技术方案如下在本方案中,汉字的数码可分为部码和笔码两部分。
部码是两位数,从00-99共100个,是这样产生的首先对汉字的笔形进行如下分析归类,以确定代码把每个汉字的第一笔笔形归纳起来,只有“点”、“竖”、“撇”、“横”四种笔画,在每种笔画的字中,若找个笔画简单的字作代表,那就是“江”、“山”、“千”、“古”四字。汉字的这四种笔画,在汉字中除“点”的笔画变化不大外,“竖”、“撇”、“横”这三种笔画,都各有“长”、“中”、“短”三种不同笔形的变化,这三种笔形的标准,是把汉字放在“九宫格”中的长度来确定,长度超过三分之二者为“长笔”,长度在三分之一以上到三分之二者为“中长笔”,在三分之一内者为“短笔”。将上述笔画分别用0-9共10个数字来做代码,“点”选用一个数字,“竖”、“撇”、“横”分别各取三个数字,以分别代表它们的长、中、短笔,例如,将“点”定为0,“横”的长、中、短笔分别为1、4、7,“竖”的长、中、短笔分别2、5、8,“撇”的长、中、短笔分别为3、6、9,这样就确定了10种笔形的代码,参见下表
汉字中绝大部分是形声字,它由形旁和声旁两部分组成,约占汉字总数的90%以上,若我们对汉字的第一部分,即它的左边上边或外边的部分的第一、二笔进行取码,就可提取到从00-99中的一个两位数组合,将两位数进行组合,这种组合共有100个,就象“部首检字法”中的部首一样,故我们称它为“部码”。部码不但能使汉字“按部归类,各有领属”,而且它还能把“江、山、千、古”四大类字群中的字,科学地规范得既有层次条理,又清楚完善,丝毫不相混杂。
汉字的第二部分是它右边、下边或里边的部分,这是提取“笔码”的部分,“笔码”是由第二部分提取四笔的笔形代码组成,四笔代码的组合排列有9999个四位数的号码,这就是说,每个部码下面拥有9999个笔码,100部码就拥有999900个笔码。笔码是对每个部码所领属的汉字“编号定位”,使字群中的汉字,能依自然的数列次序排列,在部码中“排好班,站好队”。部码中的字群,就像是一个秩序俨然,井井有条的大军阵。而不是像音序检字法的阴平、阳平、上声、去声,这四声中的字和部首、五笔检字法中每一笔画中的字那样,随便揉在一起,无先后次序可言的情况。
依照上述原则,我们对各种汉字依字体取码如下1.独体字指所有笔画相连不分开的字。笔画不多,由提取第一、二、三笔加末一笔的代码组成,不分部码和笔码,依自身的数列次序定位,如“斤”6975,“豕”7355,“聿”4748,“毛”6479,“且”8847,只有一笔、三笔的字,如乙、大、土、广、亡等其代码数为奇数,后面要加个“0”成偶数,才能成为组合码。如“万”7960,“个”9880。部码只有一笔的也要加0,如“旧”80 8811,“亘”70 5547。
2.由两部分组成的字含左右结构、上下结构和内外结构的字,第一部分取第一、二笔的代码作部码,第二部分取一、二、三笔加末笔的代码作笔码,如“组”33 8814,“朝”12 9811,“庙”07 5544,“留”32 5777,“国”88 4450,“因”88 4600等。
3.由三部分组成或更多部分组成的汉字第一部分取第一、二笔的代码作部码,笔码由第二部分取第一、二笔的代码,第三部分取第一笔的代码,再取全字的最后一笔的代码组成,以此构成六码,如“嚣”21 7321,“赢”07 2430,“廛”07 2434,衍31 3305,“扈”07 2446,“停”35 0422,“撇”18 0335等。
本方法还对汉字的复笔进行了处理,方法如下复笔是由两种邻近的单笔,为了书写方便联写而成的。因此复笔有多种形式,名称也各不相同,对他们的处理,是把它们当成单笔对待。具体作法可用顺口溜来说明复笔两笔联,两笔一笔看;笔形有多种,名称不一般;也分长中短,去短留长端;长笔定代码,标准亦似单。
现将复笔的名称、代码列表于下
本数码在计算机键盘上的安排与输入是这样实现的(参见

图1)将这100个两位数组合,依数列次序分成四个一组,共25组,分别安装在计算机键盘上标有25个英文字母的键上,N键不用,每个键上安排四个组合码,如键盘上第二排第一键是英文字母Q,在Q键上安装00,01,02,03四个组合码。
1.在键盘上第二排T与Y键,第三排G与H键,第四排B与N键之间,看成是为了左右手操作方便而划分成左右两部分的分界线,左边三排有15个键,安排从00-59共60个组合码;右边三排有11个键,只用10个键,N键不用,安排从60-99共40个组合码。
这样共用了25个键。左边第二排Q、W、E、R、T五个键为第一组,安排从00-19共20个组合码;第三排A、S、D、F、G五个键为第二组,安排从20-39共20个组合码第四排Z、X、C、V、B五个键为第三组,安排从40-59共20个组合码。右边第二排Y、U、I、O、P五个键为第四组,安排从60-79共20个组合码,第三排H、J、K、L4个键加上第四排M键共五个键为第五组,安排从80-99共20个组合码,把96、97、98、99这4个组合码安排在M键上。这样100个组合码就依次安排在25个标有英文安母的键上去了。为便于记忆可采用以下顺口溜如第一组的“08三键在中间,04 12紧相连,00 16在两边。”以后每组只把数字加大20,其它一字也不变,如第二组“28三键在中间,24 32紧三边,20 36在两边”。三、四、五组以此类推。第一句是说08,09,10,11四个组合码在第一组的第三键上,三键居中,数码也居中;第二句是说第二、第四键与第三键左右紧紧相邻;第三句是说第一、第五键又在它们的左右两边。这样你就知道每个数码在哪个键上了(0,4,8,12,16是数学级数00,20,40,60,80也是数学级数)。
2.工作时,按程序每个汉字只需在键盘上按三下与汉字数码相对应的键,萤屏上即显现出这个汉字来。如以“祖国万岁”为例。
祖03 8814按Q、K、R三键国88 4450按K、X、C三键万7960 按P、Y二键岁27 3600按S、G、Q三键3.一般汉字的数码,分“部码”和“笔码”两个部分,用6个代码表示,部码两个,笔码四个,在电脑上,一个汉字的数码,由三个组合码组成,这起到了“化繁为简”,而又“执简驭繁”的作用,同时还节省了时间,提高了二作效率。
汉字中的独体字,笔画一般不多,这类字不取部码,只取四笔作笔码,以第一、二笔作部码看待,归属于部码统领的字群之中,排在自己的数列位置上,凡是只有一笔、三笔的字,后面要加上个0成为偶数,才能成为“组合码”如“万796′0,女6′670,个9880,冉5647等,部码只有一笔的,后面也要加个0,如旧808844,亘70 5647,鬲70 2452等。
对于任何一种编码输入方法,解决重码字是关键,本笔形数码输入方法由于有其独特的编码方式,相对于现有的“五笔字型输入法”等在重码字的解决方面已大大进了一步,但仍有少部分重码字出现,于是,本方法又对重码字进行如下处理有些字的左、右或上、下边只有一笔的,如孔、轧、旦、亘、鬲、旧、司等,只有两笔的,如刨、刽、早、黄等,只有三笔的如莫、美、灼、籽等,这些字在它们左边或上边,取两笔作部码不成问题,如孔、轧、刽。早、莫等字是,若要在它们右边或下边取四笔作笔码,笔划不够。如美、约、黄等,这就易出现重码,为了避免出现重码字,为了达到取四笔的要求,也为了方便编码,故要对这些字进行技术处理。具体措施(1)对上面那些字在取笔画代码时,要将字的左、右或上、下部分对调取码,原字不动,如“刽”字的数码,本是30 58,左右部分对调后的数码,就变成58 3010了,又如“鱼”的数码本是33 70,上下对调后就变成70 3354了,如果不对调,这类字将出现不少重码字,如“剀、刿24 58,刖、删99 58,刺,蒯剽劐”42 59等这三组字都是重码字,对调后它们都不是重码字了,如“剀”58 2443,“刿”58 2430,“刖”58 9911,“删”58 9994,“刺”58 4210,“蒯”58 4261,“剽”58 4210,“劐”58 4232等,它们只是部码相同,笔码一个也不相同。汉字右、下边是一笔的,对调后要加0,如“轧”90 4645,“旦”70 5544。像“亘”、“对”、“仁”这样的字不对调。
(2)汉字右边或下边是三笔的,对调后取第一、第三两笔作部马,如“灼”30 0930,“美”72 0377,“彪”36 2116,“进”08 4465,“通”08 1055,“遮”08 0440。
(3)像部首检字法中的“鸟”部、“页”部、“见”部、“瓦”部、“殳”部、“言”部、“系”部、“欠”部等常见的部首,它们多在所组成汉字的右边和下边,如不对调取码,笔码部分的代码就完全相同,易出现重码,部码、笔码限制重码字出现的作用,就几乎完全丧失了,所以像这种情况,也需要对调取码。
经过上面这些措施,笔形数码输入法的重码字,在通过几道关卡之后,已大量地减少,虽然还有像“袄”、“袄”之类的重码字,但也为数无几,补救方法是通过屏幕显示来选取。
将本方法与“五笔字型输入法”进行比较,本方法在字根数量、繁简程度、规律性和记忆量等方面都优越于“五笔字型输入法”,具体参见下表
综上所述,本汉字输入方法具有简单、易记、规律性强、重码字少、击键次数少等优点,实用性很强。
权利要求
1.汉字笔形数码输入方法,其特征在于它将汉字以笔画为特征将其转化为数字,作为输入代码(1)以“点”、“竖”、“撇”、“横”四种笔画为基础,把汉字以国家公布的印刷字体为标准放在“九宫格”中,长度超过三分之二者确定为“长笔”,在三分之一以上至三分之二者为“中长笔”,在三分之一以内者为“短笔”,以此将“竖”、“撇”、“横”三种笔画又各分为“长”、“中”、“短”三种,将它们分别用0-9共10个数字来做代码,“点”选用一个数,“竖”、“撇”、“横”分别各取三个数,以分别代表它们的“长”、“中”、“短”笔,按上述原则,对各种汉字依字体取码如下A.独体字指所有笔画相连不分开的字,提取第一、二、三笔加末笔代码组成,取码个数为畸数时,后面加个“0”成偶数;B.由两部分组成的字含左右结构、上下结构和内外结构的字,第一部分取第一、二笔的代码作部码,取码个数为畸数时加“0”成偶数,第二部分取第一、二、三笔和末笔的代码作笔码,取码个数为畸数时加“0”成偶数;C.由三部分或三部分以上组成的字第一部分取第一、二笔的代码作部码,第二部分取第一、二笔的代码,第三部分取第一笔的代码,再取全字的最后一笔的代码,以此构成六码;D.以上对于复笔,即两相邻近的单笔为书写方便联写而成,取码时以单笔对待,各依其笔画长短,以长者为主,归入单笔“横”“竖”、“撇”的代码中;(2)代码在计算机上的安排将00-99共100个两位数组合依数列次序分成四个一组,共25组,分别安装在计算机键盘上的25个英文字母键上,“N”键不用,每个键上安排四个组合码,依照汉字的各自所取代码,对应通过各键位输入计算机。
2.根据权利要求1所述的汉字笔形数码输入方法,其特征在于复笔的归类A乛、、、 归入横笔取码;B、 归入竖笔取码;Cㄑ、 乚、 乙、 归入撇笔取码。
3.根据权利要求1所述的汉字笔形数码输入方法,其特征在于对重码的处理A.在两部分结构字中,对于第二部分只有一至二笔,而第一部分有四笔或四笔以上的,取码时将左右、上下或内外两部分对调后,再按权1的规则取码;B.两部分结构汉字中,汉字第二部分是三笔的,对调后取第一、第三笔作部码;C.汉字中有鸟部、页部、见部、瓦部、言部、系部、欠部、殳部等,字部首在右边和下边的取码时将该部首调到第一部分,做部码取码部分,按权1的规则取码。
全文摘要
汉字笔形数码输入方法,它以汉字“点”、“竖”、“撇”、“横”四种笔画为基本笔形,并各分长、中、短笔形,以此由0-9共10个数字作代码,取码时按部码、笔码分别取码,两位数一组,一般取六码共三组。在计算机键盘上的安排是将00-99共100个两位数组合,分四个一组安装在25字母键上,从而实现汉字数码化计算机输入。本方法具有简单、易记、规律性强、重码字少、击键次数少等优点。
文档编号G06F3/023GK1320856SQ0011287
公开日2001年11月7日 申请日期2000年4月21日 优先权日2000年4月21日
发明者余保荣 申请人:余保荣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1