汉字笔顺数字码输入方法

文档序号:6607082阅读:3851来源:国知局
专利名称:汉字笔顺数字码输入方法
数字键盘输入技术可用于通信产品、PC机和网络、HPC、PDA、遥控器以及信息点播等几十种产品,但至今还没有通用的而又简易的汉字字形数字输入码。
本发明的目的在于为上述各种产品提供通用的、灵活多样的和自学就会的汉字笔顺数字输入码及其键盘、语音和书写输入方法。
一二级汉字的笔顺数字码(以下简称笔顺码)已由国家规范化了,就是国家语言文字工作委员会和中华人民其和国新闻出版社于1997年4月7日联合发布的《现代汉语通用字笔顺规范》中的序号式。
《规范》规定,笔画分五类,用1-5五个数字作为它们的代码,如下1.横、挑,2.竖,3.撇,4.点、捺,5.折。
例如″人″字的笔顺全码为34,″灏″字的笔顺全码为441251141251234132534等等。
大字符集汉字中,除一二级汉字外,汉字的笔顺码,国家还没有规范化,是参照上述《规范》和《辞海》编写的。
一二级汉字的笔顺全码,字均码长10.67位,最长码长26位。大字符集汉字的笔顺全码,字均码长12.88位,最长码长48位。这些笔顺全码,由于码长过长,不能直接当作输入码来使用。要使它们成为能用来进行输入,产生技术效果的输入码,需经如下步骤处理(a)把全码按全码第一位的数字代码分类;(b)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;(c)取各类全码第一位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为一位码,重码字不超过10个;(d)各类中取过找字码后剩下的字,按全码的第一二两位的数字代码分类;(e)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;(f)取各类全码第一二两位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为二位码,重码字不超过10个;
(g)各类中取过找字码后剩下的字,按(a)-(f)的方法和步骤,继续分类、排序和取找字码,直到所有全码都有了实际使用的找字码为止,其中,每次分类的分类根据,都比前一状分类的分类根据增加一个全码中的下一位数字代码,所取的找字码也相应地比前一次取的加长一位。
(h)在(a)-(g)的过程中,难于取短于全码的找字码的全码,就取全码作为找字码,在轮到这些全码取找字码时,给这些全码排序优先权,使它们排在序列的最前面,成为重码数10以内(含10)的字。
实例1.第一位数字代码为3的一类全码,在重码数为10时的部分找字码。
3 的和人们个用我他会作31115钟锁键钉银链锾锋锁锈31生年种长等第物制重利311151 钙钳锦钝钵锚镭锗镣镊311 气毛看手知铁针短失钢3111511 钰锲锖3111 错钱钻铣锻铜铸锥销镜3111512 钴镉钍铑镙铐钶钲铒锘笔顺全码,经上述(a)-(h)处理后,所得找字码的码长分类统计如下
以上统计显示高频字字均码长3.06位,其中69%码长1-3位,94%码长1-4位。
一级汉字字均码长4.18位,其中60%码长1-4位,84%码长1-5位。
一二级汉字字均码长从10.67位缩短为4.83位,其中,70%码长1-5位,96%码长1-7位,最长码长从26位缩短为9位。
大字符集汉字字均码长从12.88位缩短为6.27位,其中60%码长1-6位,93%码长1-9位。最长码长从48位缩短为14位。
这说明一二级汉字的笔顺全码和大字符集汉字的笔顺全码,都已成了可以单独使用的汉字笔顺输入码。
上述输入码的基本的输入方法是1-5五个数字代码相应地映射在1-5五个数字键上,单手操作,进行输入;由于在该方法中,找字码和从屏幕显示引导区所显示的重码字中选取需要输入的字送至光标所在位置的送字码,都是数字码,所以在送字码前需要设重一个送字标识。
此外,上述输入码还可采用如下方法输入把数字代码映射在标准键盘的小键盘数字键上,用小键盘数字键找字,用大键盘上的横排数字键送字,或相反;或者,把数字代码单重或双重映射在字母键上,用字母键找字,用数字键送字;或者,用数字语音或数字书写方法输入。
上述汉字笔顺输入码有如下特点和优点(1)单字码长可调。
输入码的找字码都是以字频为序的有重码编码,单字找字码的码长是由单字的字频和输入码的重码数决定的,所以,可以通过人为地改变单字的频序来缩短或加长单字找字码的码长。
例如″浙″。按一般频率排序,它的找字码应是五位码44112,但它在浙江的使用频率特高,在浙江使用时,可以人为地改变它的频序,使它成为,比如说,二位码44。
单字找字码码长可调,使不同地区、不同时间、不同行业、不同工作、不同个人和不同产品所使用的不同的高频字集的找字码,可以长期地或临时地调整到系统允许的最短码位上,建立专用码表,提高输入速度。
(2)重码数可指定。
单字找字码码长可调,使重码数成为可以改变的。如果某产品所需汉字总量有限,显示屏面积又小,便可把重码数10,改为8,7,6或更小。
实例2.把实例1的重码数10,改为6时,实例1中的找字码改变如下3 的和人们个用31115锻铜铸锥销镜31 我生年种长等311151 镇钉链钙钳铺311 气毛看手知铁3111511 钰锲锖3111针钢错钱钻铣3111512 钝锚锗镊钴镉3.重码字一次显示,不换屏。
重码字屏幕引导,按重码数一次显示,不换屏。如果在当前的显示中,没有需要输入的字,可通过增加或减少码长来寻找。这虽类似于重码字换屏,但单字码长要比码长相同的重码字换屏次数容易记住。
4.编码原则一致,具体形式灵活多样,通用性强。
汉字笔顺码都是按汉字的笔顺,用笔画数字代码编码,由于单字码长可调和重码数可指定,具体单字的具体码长和实际使用的重码数都可以灵活多样,因而能满足上述几十种不同产品的不同需要,具有很强的通用性。
5.多功能的送字标识。
不论是否需要,都可以设置送字标识。设置不同的送字标识,可以使用简体汉字的输入码输入相应的繁体汉字,也可以使用繁体汉字的输入码输入相应的简体汉字,还可以跟踪检索资料库。
6.词组不编码,采用跟踪联想方法输入。这给采用词组首字跟踪、末字跟踪和指定字跟踪,以及中西文字、数字和符号混合组词组串等技术带来了方便,不仅保证了词组输入的速度,还能定义和输入混编词组和字符串。
权利要求
1.一种按汉字的笔顺,使用数字码输入汉字的方法,该方法采用1.横挑,2.竖,3.撇,4.点捺和5.折的规范的汉字笔画数字代码系统,编制汉字笔顺数字码,并跟上述数字代码与键盘上的按键、数字语音或数字书写的映射系统,以及输入时的屏幕显示引导系统相结合,构成汉字笔顺数字码输入方法,其特征在于(1)一二级汉字的笔顺数字码取自《现代汉语通用字笔顺规范》中的序号式,大字符集汉字中,除一二级汉字外,汉字的笔顺数字码,参照上述《规范》和《辞海》编制;(2)对上述笔顺数字码,(a)把全码按全码第一位的数字代码分类,(b)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字,(c)取各类全码第一位的数字代码即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的找字码,使这些字的找字码成为一位码,重码字不超过10个,(d)各类中取过找字码后剩下的字,按全码的第一二两位的数字代码分类,(e)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字,(f)取各类全码第一二两位的数字代码即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字时找字码成为二位码,重码字不超过10个,(g)各类中取过找字码后剩下的字,按(a)-(f)的方法和步骤,继续分类,排序和取找字码,直到所有全码都有了找字码为止,其中,每次分类的分类根据,都比前一次分类的分类根据增加一个全码中的下一位数字代码,所取的找字码也相应地比前一次取的加长一位,(h)在(a)-(g)的过程中,难于取短于全码的找字码的全码,就取全码作为找字码,在轮到这些全码取找字码时,给这些全码排序优先权,使它们排在序列的最前面,成为重码数10以内(含10)的字;(4)制定上述数字代码与键盘上的按键、数字语音或数字书写的映射系统,输入上述找字码,并设置送字标识,按照屏幕显示引导,把选定的字送到显示屏上光标所在位置。
2.根据权利要求1所述输入方法,其特征在于上述找字码都是以字频为序的有重码编码,单字找字码的码长是由单字的频序和系统的重码数决定的,需要时可以通过人为地改变单字的频序来调整单字找字码的码长;单字找字码码长可调,又使输入系统的重码数成为可以指定和改变的;单字码长与重码数彼此制约,使不能成为输入码的汉字笔顺数字全码转化成为能产生技术效果的汉字笔顺数字输入码;在重码数指定为10时,一二级汉字笔顺输入码的字均码长从10.67位缩短为4.83位,最长码长从26位缩短为9位;大字符集汉字笔顺输入码的字均码长从12.88位缩短为6.27位,最长码长从48位缩短为14位;
3.根据权利要求1所述输入方法,其特征在于词组不编码,可以采用首字跟踪、末字跟踪和指定字跟踪等技术输入,还可以定义和输入由中西文字、数字和符号混合组成的词组和字符串。
全文摘要
本发明采用1.横挑,2.竖,3.撇,4.点捺,5.折的规范的汉字笔画数字代码编制汉字笔顺码,并用分类、按字频排序和取短码的方法,使字均码长12.88位,不便输入的笔顺全码成为便于输入的笔顺输入码:在重码不过10时,一二级汉字找字码字均码长4.83位,大字符集汉字找字码字均码长6.27位,其中高频字找字码字均码长3.06位。可使用数字键、数字语音和数字书写输入。单字码长可调,重码数可指定,能在通信产品、PC机及网络、HPC、PDA、遥控器和信息点播等产品上使用。词组跟踪联想,可定义和输入由中西文字、数字和符号混合组成的词组和字符串。
文档编号G06F3/023GK1360247SQ9912689
公开日2002年7月24日 申请日期1999年12月28日 优先权日1999年12月28日
发明者邱国权 申请人:邱国权
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1