二维笔画汉字系统及综合应用键盘的制作方法

文档序号:6405207阅读:228来源:国知局
专利名称:二维笔画汉字系统及综合应用键盘的制作方法
技术领域
本发明属于一种汉字编码技术,在电脑中实现的方法和专用输入装置,确切地说是一种中文信息处理系统。
八十年代初,微电脑技术渗透到我国的各行各业。用户迫切希望在电脑中解决中文信息的传递和处理问题。短短几年国内外即提出400多种汉字编码方案及配套技术。已有近五十种方案在电脑中上机实用。其中在国内外有一定影响的有李金凱的“笔形编码法”(李码)和王永民的“五笔字形输入法”(王码)。其先后获得英美等国的专利。在众多编码方案中李码和王码之所以独占鳌头,是因为其编码方案是以笔形处理方案为主。在音形、字形,笔形三类编码方案中,音形最简单,但重码多,输入速度慢。字形码反映出汉字独具的特色,具有极大的前途,全国首届评测中A类方案11个,9个属于拼形码。但目前其还无法根本上解决字元太多,记忆量太大,非专业操作人员学习掌握困难的问题。说到笔形码,由于其基本笔形不多,记忆简单,取码顺序多按汉字书写笔顺因而易于掌握。这正是笔形码容易成功且为人所接收的原因。然而汉字中60%汉字均在六笔画以上,多则达二十几画。李码采取按部件取码,每部件三笔,每字八笔,显得过于冗长,无疑妨碍了其使用速度。王码虽然加了“五笔画”输入法,可以说有了很大改进,但其取码方法为前四笔依赖书写笔顺加末笔,由于相同偏旁部首过多造成重码,且编码容量也过小。在分析以上三类编码方案的基础上产生了本发明思想。
本发明的目的在于设计一种以笔形取码为基础的新汉字编码方案及其实用输入装置。这种笔形编码取码方案既需容纳充分多的笔画信息以保证汉字编码的大容量和低重码率,又要保证单字平均击键次数的明显降低以保证输入速度的加快。并在此基础上形成形码,音形码等各类新的实用编码方案及其对应的综合实用键盘。
本发明构思的关键在于以下几点1.选择具有高度概括性的高频笔形。所选取的对象是在大量试编码的基础上反复筛选而成。一般情况下应保证具有5-10种基本笔形。本发明所选取的五种基本笔形是“横”、“竖”、“撇”、“点”、“折”。笔画左斜为“撇”,右斜为“点”,笔画走向有变化即为“折”。其典型代表字“札”字里包括了全部笔画,所以本选择的方法中称其为“札”字笔画。

图1给出了这一基本构思下的笔形图表。图1中基本指法系指键盘操作时的顺序,用以做键盘布局时参考。
2.将汉字字形结构分为独体,二部位合体,三部位合体三大类,又按组成各部分的位置分为独立,上下,左右,上半包,侧半包,下半包,全包围,上中下,左中右,品字形十种基本部件结构。图4即给出汉字结构分类表,其中还代表有合体字基本结构的主要变化结构举例,图4中字模块中的数字1、2、3代表首、次、末部件排列顺序参考。实质上图4给出了按基本笔形取码时的汉字拆解总表。
3.高低笔画二维取码方案是本发明的核心构思。所谓“高低笔画”是对部位或部件取出有效笔画的原则。对取码的对象并不按书写顺序取,而是按其字形中笔画的高度,即该笔画的几何位置达最高的为高笔,最低的为低笔(不重复计算),同一高度的先左后右。例如“中”,竖(按笔顺为最后一笔)为高、横(第三笔顺)为低。“口”,竖(第一笔)为高,横(第三笔)为低。“高”、“低”笔画组成一个二维代码。所谓“二维”即一个代码中包含着二个笔画信息,这样就不但极大扩充了本编码方案所含的信息容量,而且大大加快输入速度。
4.为实现更加完善的编码方案,本发明中可将二十四种笔形分为“基本笔形”和“变化笔形”两类计九种基本笔画(见图3),如将“缺笔”也算一种正好与十位阿拉伯数字相对应形成数形笔画对应代码,也可以做具体编码方案中的设计基础。图3即为“数形笔画分类代码图表”。其中五个高频笔形选用横、竖、撇、捺、点;折、弯、钩、拐为四种变化笔形。四种变化笔形的含义是书写笔顺方向有变化,其中“横”起变化为“折”,“竖”起变化为“弯”,“撇”起变化为“拐”,“捺”起变化为“钩”。利用“数字笔形代码”编码时也采用高低笔画取码的基本原则。
5.为与本发明的“高低笔画,二维取码”方案相适应,特设计了与应用本码原则的各类具体编码方案相适用的综合实用键盘。综合实用健盘的格局设计仍沿用国际通用键盘的设计。但对25个字母键(N除外)上设置有“高低笔画二维代码笔形”。(见图5)其具体的设置是将25个字母键分为5个区,每区均以一种“基本笔形”为高笔画,即所谓高频笔画定区,每区5键分别以五种基本笔形(一丨丿丶乚)为低笔,所谓“低笔定位”;则25个所选字母就成为25个高低笔画区位代码;每个代码则内含了二个笔画,即二维信息代码。图2即给出了五种基本笔形所构成的“高低笔画区位二维代码”对照图表。“N”键则做为缺码标志。在键盘的设计中,将“数形码”的对照关系体现在数字键上面,每个数字上面均标有所代表笔形(见图5)。也可以将笔形标在小键盘的数字键上,以利实际操作(见图6)。图5、6即本综合实用键盘的一种设计方案。其中在键帽上还标有注音字母(左侧)和与英文字母对应的汉语拼音字母读音的直读汉字(右侧);这是为了方便各类用户,包括港澳与海外同胞。
在本发明上述基本构思的基础上,可以具体实施多种类型的编码方案。现仅以“二维声形”,“三笔二维”,和“二维四画”三种具体编码方案为实施例,进一步说明本发明目的是如何实现的。为了便于对照比较,特将三个实施例并列陈述如下实施例1对二部位合体字的编码方案二部位合体字包括上下、左右、上半包、下半包,侧半包,全包围六种结构(包括几种变化形式可参考图4)是汉字主要结构类型。
(1).二维声形码编码方法取本字读音的声母做为本字的首码,再按本字两部位分别取高低笔画组成高低笔画二维代码两个,结合首码形成一字三码。如果该部位是单笔画的,例如“札”字中的“乚”即重复取码为“折区折位”(即Z)。
(2).三笔二维码编码方法三笔二维编码时完全依赖笔形,不涉及读音。如果二部位合体字可以拆为三个部件的(参看图4中变化结构),则分别对首、次、末三个部件取高低笔画组成三个二维代码,如果构不成三部件的,如“好”,“庆”,则补上“N”也组成一字三码。
(3).二维四画码编码方法二维四画是一种纯笔画编码,一字四码,由4位数字组成。数字代码参看图3。对二部位合体字对每部位分别取高低笔画,实际上是两个二维码,但这里用四个数码表示。
下面举实际编码例子列表如下汉字结构部位数部件数二维声形三笔二维高低四画忠上下22IHXHXN2195霜上下23VSHSKH1521楚上下23ULXKLX2469好左右22HCZCZN8367数左右23VMWKCW2834结左右23JBHBHH8121庆上半包22QIWIWN5334风上半包22FPIPIN3693旬上半包22XQHQHN3621区侧半包22QAIAIN1793巨侧半包22JABABN1761匹侧半包22PAQAQN1737赵下半包23ILIHLI2993这下半包22IOOOON5959函下半包22HZVZVN6772回全包围22HHHHHN2121国全包围22GHGHGN2111圆全包围22YHLHHL2125
实施例2,三部位合体字的编码方案三部位合体字包括上中下,左中右,和品字形三种结构,其编码规则与二部位字类似。
(1).二维声形码的编码方法首码仍为本字声母,其笔形码有两个,一个是对首部位所选取的高低笔画二维代码,一个是由次部位高笔和末部位低笔所组成的二维代码,从而组成一字三码。
(2).三笔二维码编码方法本字编码一字三码,分别对首、次、末三部位取高低笔画组成三个二维代码,遇到单笔画部位取重复笔画。
(3).二维四画码编码方法对三部位合体字取首部位的高低笔画,次部位的高笔画和末部位的低笔画,组成一字四码。遇到首部位单笔画时,低笔画补“0”。
下面举实际编码例子列表如下汉字结构部位数部件数二元声形三笔二维高低四画曼上中下33MHLHHX2124褒上中下35BYWYWW5134赢上中下36YPMPHQ5726微左中右35WRLRMW3224嫩左中右33NCLCKW8324搬左中右34BBWBQW7134品品字形33PHHHHN2121轰品字形33HVXVXX8264
实施例3对独体汉字的编码方法独体汉字因为其常具有二义性笔顺难以形成统一,从而使笔形取码困难,在本发明中由于不考虑笔顺几何位置高低而带来极大的方便。
(1).二维声形码编码方法其以本字读音声母做为首码,再按高低顺序取一、二、三笔画加上低笔画,一、二笔,三、末笔结合形成两个二维代码,从而组成一字三码。构不成两个二维代码的字以“N”补足三码。
(2).三笔二维码编码方法对独体字按几何位置高低顺序依次取出一、二、三、四、五、加低笔画共6个笔形信息,依次奇偶搭配组成三个二维代码,不足三码者以“N”补齐。
(3).二维四画码编码方法二维四画对独体字的编码是自高而低取一、二、三笔加低笔,相同高度先左后右,再依其对应的数码组成一字四码。同字不取重笔,不足者以“0”补齐。
下面举实际编码例子列表如下汉字结构二元声形三笔二维高低四画我独体WQIQPK3953为独体WIXIXN5365人独体RWNWNN3400民独体MZAZGZ6719有些字的结构,超出了图4所列的范围,形成多部位合体字。本系统对多部位合体字采取如下三种办法处理
1.有些多部位合体字既可视为上下结构,又可视为左右结构,对此一律以左右结构处理。
例如“能”、“疑”,其编码为汉字二维声形三笔二维二维四画能NZZXMZ8677疑YZXXCWX79692.有些多部位合体字是由两个独体或合体字构成本系统按二部位合体字处理。例如汉字二元声形三笔二维二维四画羮GOOYOO5554鼷XQWQEL39343.有些多部位合体字虽然不是由几个字组成,然而可以清楚地分为三大部分,则可按三部位合体字处理。例如汉字二元声形三笔二维二维四画鼍THMHHM2127爨CQLQLW3624对于特殊几个离散结构的单字编码按个别处理。对于“二”、“三”、“八”、“儿”、“川”等几个单字,本系统称之为“离散结构”的单字,不能按合体字编码。例如汉字二元声形三笔二维高低四画二EGNGNN1100三CGCGGN1110八BWNWNN3400
儿EQNQNN3700川URJRJN3220以上三个实施例中给出了三种完整实用的汉字编码方案,其均建立在高低笔画取形,二维代码组字的发明构思之上。在这个基础上还可以进一步对常用一、二级高频字编制简码,以实现常用高频字的快速输入。还可在此基础上设置高频词码,以进一步提高汉字传输与显示的速度。由于本发明构思中单码二维信息容量大,其无论是将来形成的高频词库或是应用时的操作速度都将远远超过现有的汉字处理系统。
本发明的实现可以将汉字库的范围加大而且保证极低的重码率。由于本发明构思中的基本笔形少,取码方法唯一,组码法则好学易记,所以非常容易掌握,应用和推广。本发明中实用键盘的设计,附合操作员的指法,因而可以在短时间内学会,掌握操作方法并达到高速度速输入的熟练成度,可以广泛地应用于各种型号的计算机,中英文打字机,传真机和汉字终端设备之中,是一个有普及推广前景的新汉字编码及信息处理技术。
权利要求
1.一种利用汉字的读音、拼形,笔我约叭咧浣岷鲜迪趾鹤执涞男畔⒋硐低常涮卣髟谟诟孟低持胁捎昧 -10个汉字笔形做为基本笔形,对字形采用独体,二部位,三部位的分类方法,并利用基本笔形的代码对汉字组成部件按高低笔画二维取码,从而形成二维声形,三笔二维、二维四画三类汉字编码方案,以及与三类方案相对应的综合实用键盘。
2.根据权利要求1所说的信息处理系统,其特征在于基本笔形选取5种高频笔形横、竖、撇、点、折,以该五种笔形为高笔画定区,每区以该五种笔形为低笔画定位,从而形成25种高低笔区位代码与26个英文字中的25个对应(图2),从而形成一个代码内含双笔画二维笔形信息的编码方案。
3.根据权利要求1所说的信息处理系统,其特征在于基本笔形除选用五个高频笔形,横、竖、撇、捺、点以外,再选取四种变化笔形折、弯、拐、钩、加上缺笔共计十个,以十个阿拉伯数码为对应代码(见图3),从而形成数形二维取码的数字汉字编码方案。
4.根据权利要求1所说的信息处理系统,其特征在于在处理汉字编码方案时将汉字按块状结构分为独体,二部位、三部位的基础上再细分十种部件类型,组成一个汉字拆解总表(图4)做为实现汉字编码基本方法。
5.根据权利要求1或2或4所说的信息处理系统,其特征在于二维声形编码方案在电脑中实现的具体方法如下a.取本字读音声母做为首码,b.将独体字按笔画的高低位顺次取出一、二、三、笔加上末笔,一、二笔结合,三、末笔结合构成高低二维码两个,结合首码形成一字三码,构不成三码的以“N”补齐三码,c.二部位合体字,对每部位取高、低笔画组成高低二维码两个形成一字三码,单笔画部位重复取笔画,d.三部位合体字,取首部件的高低笔画组成该字第二码,由次部件高笔画和末部件的低笔画构成该字第三码,仍为一字三码。
6.根据权利要求1或2或4所说的信息处理系统,其特征在于三笔二维编码方案在电脑中实现的具体方法如下a.独体字自高而低依次取一、二、三、四、五和末笔画,顺次奇偶搭配构成三个二维代码,不足三码以“N”补齐后组成一字三码,同高度笔画选取顺序先左后右;b.二部位合体字对首部件、次部件、末部件分别取高低笔画形成三个高低笔二维代码,不足三部件的取首、末部件二维代码后补“N”同样形成一字三码,c.三部位合体字分别取首,次、末三部位高低笔形组成三个二维代码,单笔画部位重复取笔画,以保证一字三码。
7.根据权利要求1或3或4所说的信息处理系统,其特征在于二维四画汉字编码方案在电脑中实现的方法是a.独体字自高而低取出三笔画,加上末笔画,以其数字代码组成一字四码,取笔画时相同高度自左而右,同字之内不取重笔,b.二部位合体字对每部位按高低笔画取,组成每字等长四码,同一部位不取重码,缺位补“0”,c.三部位合体字取首部位的高低笔画,次部位高笔和末部位低笔从而形成一字等长四码,首部位独笔画时补“0”。
8.根据权利要求1或2或3所说的信息处理系统,其特征在于综合实用键盘的格局可采用国际通用键盘形式,在数字键上标注有与数字码对应的笔画,在26个字母键上标注有与其相对应的高低笔画(见图5),用N(NO)表示缺笔画不足以构成二维代码。
9.根据权利要求1或4所说的信息处理系统,其特征在于取高低笔画时遇到三个以上部位的合体字时,其遵守以下原则a.可视为左右,也可视为上下结构的多体字一律按左右结构的二部位合体字处理,由独立部件按二体字处理,b.可视为三部位合体字时划归三部位合体字处理。
10.根据权利要求1或2或3或4所说的信息处理系统,其特征在于可根据高低笔画二维代码的编码方案编制高频词码及常用高频字简码,从而组成一个完整的编码系统。
全文摘要
本发明涉及到一种新的汉字信息处理系统,它包括一种笔形编码方案及其实用综合输入装置。本发明的关键在于选取5—10种基本笔形;并将汉字分为独体,二部合体,三部合体结构;利用基本笔形对汉字部件进行高低笔画二维笔形取码。在以上笔形码的基础上建立了二维声形,三笔二维,二维四画三种汉字编码方案。由于本编码方案信息容量大、重码率低,输入速度快,尤其是形成区位式实用键盘,使本发明在将来的电脑汉字化进程中有普及推广的前景。
文档编号G06F3/023GK1036087SQ88101668
公开日1989年10月4日 申请日期1988年3月26日 优先权日1988年3月26日
发明者栗兴民 申请人:栗兴民
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1