角形数字码编码法及其键盘的制作方法

文档序号:6416858阅读:340来源:国知局
专利名称:角形数字码编码法及其键盘的制作方法
技术领域
本发明涉及计算机编码法及其键盘,特别是一种不拆分汉字,认知汉字角形就能进行快速编码的角形码输入方法及其键盘。
汉字是世界上最古老的文字之一,是世界上使用人口最多的文字,是华夏子孙乃至全人类的宝贵文化财富;汉字所记录的语言,属世界五大语言之一,也是联合国的工作语言之一。为使汉字能够进入计算机并可参与信息处理,众多汉字编码专家,计算机专家已创造出近千种汉字编码方案。对促进汉字与计算机的结合,推动计算机在我国的普及应用,进而促进社会发展,提高社会生产力发挥了巨大的作用。从1986年在北京举行的首届“汉字编码动态测试”活动看,被测方案中“形码”比重很大,占58.82%。这是因为汉字在其几千年的发展过程中,走过了从象形到指事到会意到形声而成为图形表意文字这样的一个大概过程。而现代的“方块”汉字是古老象形文字的继续和发展。对汉字的“有理”编码,自然应从“音、形、义”三个方面入手。然而,同“音”的汉字太多,同“义”的汉字较少,同“形”的汉字没有。就是说现有任何一部汉字字、词典上,不存在形象完全相同的汉字,这说明了众多汉字“无重形”。因此,用汉字的各种“形”对其编码,是汉字编码的一个重要方向。现有“形码”认为任何一个汉字都是由若干个由基本笔划组成的部件(从前称字根或字元)构成的。并将其编为代码,合理分配在键盘的相应键位上。按照一定顺序(多采用书写顺序)对汉字进行拆分而对其编码。以“笔画部件”为基础的“拼形码”,大多存在着一定的拆分“二义性”,为降低重码率多又结合其较复杂的汉字结构进行编码。因而普遍存在着记忆量偏大、学习较困难等问题。然而,对汉字用0~9十个阿拉伯数字进行编码,要想做出高性能指标的数字编码,其难度就更大,非创造性工作不能达此目的。
本发明的目的提供一种不拆分汉字,仅认知汉字角形就能进行快速编码的角形码输入方法及键盘,并能解决小键盘汉字角形数字编码问题。
编码实现理论基础汉字是由一笔一划构成的,汉字又是由偏旁部首构成的。由于一字多音、一音多字、一字多义、一义(或近义)多字的存在。使得汉字编码单从音或义上来实现,想达到不重码是不可能的。而汉字之所以能被严格地一一无漏地区分开来,在于它们具有不同的“形”,而汉字最大的“形”莫过于它的“方块形”。利用汉字的角形进行编码就能够做出较理想的编码,并具有其独特的直观性。
1、由“笔形”认知“笔型”方块汉字的角形是由大量笔形体现的,而这些笔形又是由大量笔划构成的。就汉字的笔划而言有二十八种(71年版《新华字典》),偏旁部首有二百零一个(1983年《国家文字改革委员会、国家出版局偏旁部首规范》),国家语言文字工作委员会于1997年11月发布的《信息处理用GB13000.1字符集汉字部件规范》中的“部件”有五百六十个之多。我们在对大量汉字进行了大量地分析研究、科学试验的基础上,压缩精选出了10类最能表征汉字角形信息的相对不变的笔形—笔型。依据人体工程学原理、综合考虑了键入速度、键位使用频度、重码率、均匀度、便于记忆等诸因素,将其合理地非均匀地离散于0~9十个数字键位上。而实现了用角形对汉字进行编码。
2、汉字角形信息分类以国标2132字库为基准,我们统计计算出10类笔型分别占有的百分比如下(精确到小数点后二位)“方”占9.19%;“横”占8.11%;“撇”占9.56%;“竖”占9.35%;“交”占12.6%;“插”占8.16%;“盖”占11.62%;“拐”占8.32%;“八”占11.56%;“小”占11.47%;由此可见,其分类合理、分布均匀、相当理想。
角形数字码编码原理角形数字码充分把握住汉字的整体外形是方块形状这一重大而显著的特征,将汉字的角所蕴藏着的丰富的笔“形”信息,科学归类整理为10类相对不变的笔型,转换成数字信息,并按照一定顺序排列起来,就实现了对汉字的数字化编码,这种数字化编码可很方便地在各种小型设备及现有通用大键盘的数字键位上,进行汉字输入和处理。
本发明将规范汉字不拆分,只根据汉字角形而作出取角原则;将表征角形信息的笔型对应0~9十个数字键位;并由此形成本发明的单字录入,简码、准简码拾取,词组录入,特殊字符录入。所述取角原则为(a)外角码对汉字实行从左到右、从上到下的顺序按其四角笔型代码进行编码;(b)下角“无”笔型者,代码为6;(c)一个笔型前角用过用6补充;(d)一个笔型整覆其上,右上角码取左上内角码;(e)“门”一类字除第一码外,其它取相应内角码;(f)右下角属竖钩则取内角码;(g)不论位置如何若遇方框,首次取之,其次取内角码;(h)右下角内角码作单字编码的第五位码。所述表征角形信息的10类笔型分别对应于0~9十个键位上,它们是方;横(含提);撇(含二、两点水);竖(含点捺、三、点水);叉(含两笔交叉者);插(一笔纵插两笔者);盖(宝盖、点下横、点下横折);拐;八(八含单人);小(小及其变形、草头、刀头)。并可用一句话高度概括帮助记忆方零横一撇二二,竖捺三三交叉四,竖钩插五点横六,拐七八八小头九。所述取角原则及笔型代码认定任何一个汉字既有外角又有内角。所述简码、准简码拾取法是(a)一级简码,旨在依据各类汉字字频表灵活取用十个高频字分别对应0~9十个键位;(b)二级简码、准简码,意在取单字编码前两码加空格键,它包容了大量不易与其它单字组词的介词、连词等;(c)三级准简码,取其单字编码之前三码,对一千多常用汉字全部包含;(d)由单字编码的前四码构成了包容规范汉字中的6763个汉字字符。所述准简码、单字重码,按提示行所示字符选择录入。所述词组最长编码采用五位码,(a)双字词由首字前一、二及末字前三码构成;(b)三字词取前两字首码及末字前三码;(c)四字词取前三字首码及末字前两码;(d)五字以上词由前四字及末字首码组成。在单字或词组需要精简压缩时,单字、词组最长编码可采用四位编码,分别省编末码。前述要求之任一条对单字或词组进行输入的方法,可移植于任一大、中、小型汉字信息电子计算机处理系统中。将所述的角形数字码编码法移植于任一设备时,0~9十个阿拉伯数字键位可依据实际灵活安排设计。对汉字单字或词组进行编码的方法,不仅适应于国标基本字符集,还可对《GB7589-87》及《GB7590-87》两个辅助集进行编码,也可对繁体汉字进行编码,并可做为各种大、中、小型汉字字、词典的索引工具。
角形数字码的特点角形数字码编码方案,符合国家语言文字工作委员会于1997年11月发布的《信息处理用GB13000.1字符集汉字部件规范》及其国家有关规定,并通过了中国人民解放军总参通信部于1998年12月19日在京召开的《掌上型汉字输入系统》技术鉴定会。其主要特点是1.不肢解汉字,不论字的复杂结构,规则简明,好学易记,使用方便,适应于不同层次的各类人员使用;2.具有“形码”的优点,比如对不识之字同样可以编码等;3.各项技术性能指标好,无论是与现有大键盘输入编码相比,还是与现有数字编码比较,都达到了较高水平;4.均匀度高对国标汉字基本集(GB2312-80国标字符集)的6763个汉字、字符,完全实现五码输入不翻“页”(同码字不超过5个),四码输入实现99.1%不翻“页”;而对常用汉字一级字库的3755字而言,完全实现四码输入不翻“页”;5.可实现盲打由于该编码重码率低、均匀度高,再加上简码等技术处理,可满足盲打要求;6.编码空间利用率高,挂接词组能力强经试验在单字、简码基础上,挂接2万左右词组不破坏上述性能指标;7.单字、简码、标点及特殊符号与词组间实现编码自然分离,无须键位切换;8.该编码不仅适应于基本字符集,还可对GB7589-87及GB7590-87两个辅助集进行编码。不仅如此,该数字编码还可做为各种大、中、小型字、词典的索引工具。


图1双手操作键位2单手操作键位图角形数字码编码规则实施例。
1、单字录入编码规则角形数字码对汉字实行从左到右、从上到下的顺序提取笔型代码进行编码。其笔型代码可用一句话概括记忆方零横一撇是二,竖捺为三交叉四;竖钩插五点横六,拐七八八小头九。例如键入4191即可出现桓字,键入2889就是徐字等。对于一、二级字库而言外角四码输入就足够了。若要实现盲打,则再于右下角提取一内角码,如键入41910桓字就会唯一出现(当然四码桓字也可能是唯一的)。
2、角形数字码简码录入编码规则为了提高汉字录入速度,方案依据汉字字频表,设置有一、二、三、四级简码。其规则是1.一级简码0+空格=的 1+空格=中2.二、三、四级简码0~9十个键位上分别对应着十个汉字,它们是是一我了有这就在人和。其规则是键位码前加0。如“是”字键入00加一空格即可;“一”字键入01加一空格就行,等等。其它分别由单字编码的前二、三、四码构成。如38=以、74=对、034=别、036=唉、3305=战,等等。
3.角形数字码词组录入编码规则词组编码与单字编码相一致,采用五位编码。
1.双字词取首字的第一、二及末字的前一、二、三码。如软件=478562.三字词取前两字的首码和末字的前一、二、三码。如出版社=326493.四字词取前三字的首码及末字的前一、二码。如争分夺秒=984294.五字以上词取前四字及末字的首码。如全国各族人民=8026权利要求
1.一种角形数字码编码法及其键盘,其特征是本发明将规范汉字不拆分,只根据汉字角形而作出取角原则;将表征角形信息的笔型对应0~9十个数字键位;并由此形成本发明的单字录入,简码、准简码拾取,词组录入,特殊字符录入。
2.如权利要求1所述的角形数字码编码法及其键盘,其特征是所述取角原则为(a)外角码对汉字实行从左到右、从上到下的顺序按其四角笔型代码进行编码;(b)下角“无”笔型者,代码为6;(c)一个笔型前角用过用6补充;(d)一个笔型整覆其上,右上角码取左上内角码;(e)“门”一类字除第一码外,其它取相应内角码;(f)右下角属竖钩则取内角码;(g)不论位置如何若遇方框,首次取之,其次取内角码;(h)右下角内角码作单字编码的第五位码。
3.如权利要求1、2所述的角形数字码编码法及其键盘,其特征是所述表征角形信息的10类笔型分别对应于0~9十个键位上,它们是方;横(含提);撇(含二、两点水);竖(含点捺、三点水);叉(含两笔交叉者);插(一笔纵插两笔及以上者);盖(宝盖、点下横、点下横折);拐;八(八含单人);小(小及其变形、草头、刀头)。并可用一句话高度概括帮助记忆方零横一撇二二,竖捺三三交叉四,竖钩插五点横六,拐七八八小头九。
4.如权利要求1、2、3所述的角形数字码编码法及其键盘,其特征是所述取角原则及笔型代码认定任何一个汉字既有外角又有内角。
5.如权利要求1、2、3所述的角形数字码编码法及其键盘,其特征是所述简码、准简码拾取法是(a)一级简码,旨在依据各类汉字字频表灵活取用十个高频字分别对应0~9十个键位;(b)二级简码、准简码,意在取单字编码前两码加空格键,它包容了大量不易与其它单字组词的介词、连词、形容词、副词等;(c)三级准简码,取其单字编码之前三码,对一千多常用汉字全部包含;(d)由单字编码的前四码构成了包容规范汉字中的6763个汉字字符。6.如权利要求4、5所述的角形数字码编码法及其键盘,其特征是所述准简码、单字重码,按提示行所示字符选择录入。
7.如权利要求1、3、4所述的角形数字码编码法及其键盘,其特征是所述词组最长编码采用五位码,(a)双字词由首字前一、二及末字前三码构成;(b)三字词取前两字首码及末字前三码;(c)四字词取前三字首码及末字前两码;(d)五字以上词由前四字及末字首码组成。
8.如权利要求1、4、7所述的角形数字码编码法及其键盘,其特征是在单字或词组需要精简压缩时,单字、词组最长编码可采用四位编码,分别省编末码。
9.如权利要求1~8所述的角形数字码编码法及其键盘,其特征是前述要求之任一条对单字或词组进行输入的方法,可移植于任一大、中、小型汉字信息电子装置中。
10.如权利要求1~9所述的角形数字码编码法及其键盘,其特征是将所述的角形数字码编码法移植于任一设备时,0~9十个阿拉伯数字键位可依据实际灵活安排设计。
11.如权利要求1、2、3、4、7、8所述的角形数字码编码法及其键盘,其特征是其所要求之任一条款,对汉字单字或词组进行编码的方法,不仅适应于国标基本字符集,还可对《GB7589-87》及《GB7590-87》两个辅助集进行编码。
12.如权利要求1~11所述的角形数字码编码法及其键盘,其特征是所述码编码法也可对繁体汉字进行编码,并可作为各种大、中、小型汉字字、词典的索引工具。
全文摘要
本发明将规范汉字不拆分,只根据汉字角形而作出取角原则;将表征角形信息的笔型对应0~9十个数字键位;并由此形成本发明的单字录入,简码、准简码拾取,词组录入,特殊字符录入。充分把握了汉字整体外形为方块形这一特征,在对6000多汉字的种种笔形进行了大量分析、研究及试验的基础上,精选出10类不足20个最能表征汉字角形信息的相对不变地笔形-笔型,综合考虑了键入速度、键位使用频度等因素,将其合理地非均匀地离散于0~9十个阿拉伯数字键位上,本发明的特点是不肢解汉字,非常直观,好学易用。
文档编号G06F3/023GK1270344SQ9911643
公开日2000年10月18日 申请日期1999年4月14日 优先权日1999年4月14日
发明者姜岱源, 李文修 申请人:中国人民解放军通信指挥学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1