推广型林码汉字输入方法

文档序号:6410543阅读:327来源:国知局
专利名称:推广型林码汉字输入方法
技术领域
本发明涉及计算机中文信息处理领域的计算机汉字编码输入技术。
计算机在人类当今的社会生活中发挥着巨大的作用。计算机在中国的普及利用很大程度上取决于计算机对汉字信息的处理水平。其中包括汉字的输入,输出,汉字信息检索,汉语的理解等等方面。汉字输入是目前比较热门的领域。计算机汉字输入有三个主要方面,即计算机汉字键盘输入,汉语语音输入,联机手写汉字识别输入和光学汉字识别输入。其中汉字键盘输入技术现阶段占主导地位。
汉字是表意文字,不同于西方拼音文字,汉字形体复杂,数量庞大,输入计算机有很大难度。经过多年的努力,已经有了汉字编码方案和输入系统。汉字键盘输入已经成为可能。但是完全令人满意的输入方案还没有研究出来,要真正达到易学,易用和高效的目标,还需要进一步努力研究。
汉字具有音,形,义三个方面的属性。所有输入方案都是基于这些属性的,根据所使用的特征,输入方案可以分为音码,形码,以及音形码等。各种方案都有长处和短处。
目前汉字输入技术向着横向和纵向两方面发展。横向就是单字输入,目标要达到易学,高效,规范;纵向是字,词,句输入,通过智能化处理,解决易学与高效的矛盾。
汉字的发音特征比较简单,字多,但音不多、所以音码的单字重码很多。
汉字的字形特征很复杂,从不同角度可以有不同理解,导致了众多的形码方案,字形多,特征多,码多,重码少,难学,难记。
下面,以几种常见的汉字编码方案为例,比较具体地进行性能分析和比较。
音码输入方法,使用汉字的发音特征来进行编码;易于掌握,但重码高,虽然可以通过智能手段使重码率有所降低,但系统开销较大,效果有限,很难盲打,速度较慢;对汉语拼音的要求较高,有地域和年龄层的限制;在大字符集内的使用有限制。
笔画编码法,将笔画按不同的形态分为若干类,依笔画书写顺序,把汉字一笔一画地编码输入;易于掌握,会写汉字就会输入,但是编码效率很低,重码多,码长长。
五笔字型编码方案,是字根类编码,按照汉字字根的使用频度,将字根挑选归类,分配键位,以”字根拼形”完成整字输入;特点是字根键位熟记以后,输入速度较快,存在的问题是1.字根较多,记忆负担大;2.200多个一级字根的选取以统计为基础,字根键位的分配依据”相容性原理”确定,所谓相容性有一定统计范围,在字符集GB2312-80和ISO10646中的统计结果肯定不同,也就是说,在GB中相容的字根,在ISO中可能就不相容了,其结果会导致重码率的变化;3.二级字根和非字根单体字的输入要拆分成一级字根,拆分过程的规律性和规范性不强,拆分二义性大;4.末笔字型识别码难于掌握和使用。
总之,就目前来看,汉字字形输入趋向于在专职录入人员范围使用,一般人员如果会拼音则满足于使用拼音。这样汉字字形特征的使用越来越趋向于认读,而输入时使用字音特征,从而输入和认读过程不统一,这样会读不会写的情况就会出现。
本发明认为汉字字型特征是其独有的特点,不应该偏废,汉字的计算机输入应该和汉字书写有机结合,使得中国电脑用户,特别是中小学生在敲键过程中掌握书写方法,达到和谐统一的境界。
林码汉字输入方法(专利申请94117506.5)公开了一种利用键盘模拟书写过程的方法,林码将汉字拆分成字根、笔画组件,归纳字根、笔画之间的相对位置关系,并把这种关系和键盘上键区、键位相结合,从而达到在键盘上书写的目的。本发明是林码的推广,其任务与林码类同,即1.解决汉字编码中普遍存在的易学,易用与高效之间的矛盾,找到一种同时具备笔画码和拼音码的易学性,又具备字根码的高效性的编码方案;2.缩小手写与敲键之间的差异3.使编码过程符合人的思维习惯4.使编码符合文字规范;5.使编码符合人机工程的研究结果;6.建立一套统一,完备的文字特征描述体系,以适应大字符集中各种文字符号的需要。
为了实现这个任务,本发明采用了与林码不一样的方法。林码也使用了汉字组件的相对位置关系,它把汉字组件的位置关系与键位的位置关系相结合,是一种隐含的方法,本发明将这种位置关系代码化,是一种显式方法。
汉字的书写是一个非常复杂的过程,各种字形输入方案其实都是对这一过程的一种反映。长期以来,汉字书写过程中的一个非常重要又似乎非常隐蔽的环节没有被加以重视。
下面对书写汉字“二”时,人手和笔的动作过程进行仔细分析开始第一步,手持笔,将笔尖移动至第一个横笔画上方;第二步,手将笔尖下压,定位于纸上;第三步,手持笔,将笔尖在纸上自左至右移动、形成笔画痕迹;第四步,手将笔尖抬起,悬空;
第五步,手持笔,将笔尖向左下方向移动至第二个横笔画上方;第六步,手将笔尖下压,定位于纸上;第七步,手持笔,将笔尖在纸上自左至右移动,形成笔画痕迹;第八步,手将笔尖抬起,悬空;收笔。
这是一个完整的汉字“二”的书写过程。在计算机键盘上,第三步和第七步很容易完成,只要敲击横笔画对应的键即可;而第二、四、六、八步也很容易和键的压下、抬起对应;但第一、第五步,特别是第五步,即笔尖从当前位置悬空移动到下一个位置的走向往往被忽略了,计算机没有得到这一个很有价值的信息。
从字根角度来看,当前字根书写完成后、笔尖移动到下一个字根的起点,这种笔尖悬空移动的规律也没有得到充分的使用。
本发明就是将这种笔尖悬空移动的规律进行归纳总结,并为之编代码,作为汉字输入过程的一部分,使得计算机能够得到汉字二维完整信息,充分模拟笔书写过程。
上述笔画、字根之间笔尖悬空移动走向被编码后,作为笔画、字根之间的位置提示符号。
字根之间使用位置提示符号,也是字根代码的分隔符,于是,林码汉字输入法中公开的动态组合编码在此也可以得到应用。
为了提高效率,结合频度特征可以采用简码技术缩短码长。
本发明适用于任何涉及敲击、点触类输入设备。
本发明也可应用到笔输入设备,即将输入区域分为实笔画区域、虚笔画区域,实笔画指笔尖在纸上的移动痕迹,虚笔画指笔尖悬空移动的轨迹。
本方案的优点和效果1.对文字书写过程做全画的仿真模拟,即使用点触设备模拟笔输入设备;2.完全保留笔输入过程的易学性和适用性;3.通过使用动态组合码表和简码技术,可以实现较为高效的输入系统。
下面结合附图和实施例对本发明做详细介绍。
图1为对汉字笔画间相对位置关系的归纳分类编码;图2为对汉字字根间相对位置关系的归纳分类编码;向下、向右、交叉,向上 向左的笔位关系分别用下列符号表示↓、→、×、↑、←;向下、向右、包含、向上、向左的根位关系分别用下列符号表示∨ >、⊙、∧、<。
下面描述三个实施例,说明各种位置关系的用法。实施例1本方案的特点是使用汉字笔画间的位置关系代码。笔画分类将汉字笔画分为横、竖、撇、捺、折五类,定义在五个键位上。键位安排按照键位使用个数的多少,对笔画位置关系进行取舍、合并。两个笔位代码键图3,向下、向左共用一键,向上、向右共用一键,交叉按笔画起点之间位置关系分在两个键位上。
例如“十”的交叉笔位并入向上、向右键,“义”的交叉笔位并人向下、向左键。
向下、向左不仅包括正左、正下、它包括从左上方向逆时针转至右下方向的一个方向区域;向右、向上不仅包括正右。正上,它包括从左上方向顺时针转至右下方向的一个方向区域笔画起点相同,则不使用笔位代码、如“厂”三个笔位代码键图4,向下、向左共用一键,向上、向右共用一键,交叉笔位安排一个键位。五个笔位代码键图5,每种笔位各安排一个键位。取码方法取码方法有定长方式和不定长方式,本实施方案采用定长方式,最长六码,笔画不足则按具体笔画定码。
单体字依书写顺序提取笔画代码和笔位代码,例如,“木”一×丨↓丿丶两体字每个根取前两笔画以及对应的笔位代码,例如,“林”一×丨一×丨三体及三体以上前三根取第一个笔画和第一个笔位代码,例如,“案” 丶←乙×一×实施例2本方案的特点是使用汉字字根间的位置关系代码。
笔画分类将汉字笔画分为横、竖、撇、捺 折五类,定义在五个键位上。
键位安排按照键位使用个数的多少,对字根位置关系进行取舍、合并。
两个根位代码键图6,向下、向左、包含共用一键,向上、向右共用一键;三个根位代码键图7、向下、向左共用一键,向上、向右共用一键,包含根位安排一个键位;五个根位代码键图8,每种根位各安排一个键位。取码方法取码方法有定长方式和不定长方式,本实施方案用不定长方式,使用笔画描述字根,在字根之间插入字根位置指示代码,根位代码作为字根笔画序列的分隔符号,所以给字根笔画的码长提供了较大自由度,本方案采用林码汉字输入方法(专利申请94117506.5)中公开的动态组合码表方法,简码按频度设定。
单体字依书写顺序提取笔画代码、例如、“木”一丨丿丶多体字每个根由笔画代码表示,字根之间插入根位代码,例如,“林”一丨丿丶>
一丨丿丶“案”丶丶乙∨乙丿一∨一丨丨丶实施例3本方案的特点是同时使用汉字笔画和汉字字根间的位置关系代码。
笔画分类将汉字笔画分为横、竖、撇,捺、折五类,定义在五个键位上。
键位安排按照键位使用个数的多少,对笔画、字根位置关系进行取舍、合并。
三个笔位代码键、两个根位代码键图9,向下、向左笔位共用一键,向上、向右笔位共用一键,交叉笔位安排一个键位;向下、向左以及包含根位共用一键,向上、向右根位共用一键;五个笔位代码键、五个根位代码键图10,每种笔位、根位各安排一个键位。
取码方法取码方法有定长方式和不定长方式,本实施方案用不定长方式,使用笔画描述字根,在笔画代码之间插入笔位代码,在字根之间插入字根位置指示代码,根位代码作为字根描述代码序列的分隔符号,所以给字根笔画的码长提供了较大自由度,本方案采用林码汉字输入方法(专利申请94117506.5)中公开的动态组合码表方法,简码按频度设定。
单体字依书写顺序提取笔画代码和笔位代码,例如,“木”一×丨↓丿丶多体字每个根由笔画代码表示,字根之间插入根位代码,例如,“林”一×丨亅丿丶>
一×丨↓丿丶“案”丶←丶乙∨乙×丿↑∨一×丨↓丿丶


图1.笔画位置关系分类图2.字根位置关系分类图3.五个笔画键、两个笔位键图4.五个笔画键、三个笔位键图5.五个笔画键、五个笔位键图6.五个笔画键、两个根位键图7.五个笔画键、三个根位键图8.五个笔画键、五个根位键图9.五个笔画键、三个笔位键、两个根位键图10.五个笔画键、五个笔位键、五个根位键
权利要求
1.一种推广型林码汉字输入方法,按照汉字的形体结构和书写规范,将汉字拆分成为多层次的构成组件,根据各组件的形态特征进行分类和定义编码,通过使用汉字的构成组件的编码表示整个汉字,从而将二维的汉字图形转化成为一维的代码序列,其特征是分析和归纳汉字构成组件之间的各种二维的相对位置关系,对其分类并定义编码,称为位置代码,将位置代码插入到相应的组件的代码中间,对它们的相对位置关系进行提示。
2.按照权利要求1所述的方法,其特征是对汉字的笔画组件之间的各种相对位置关系归纳分类,形成笔画位置码,插入到笔画代码之间对笔画的位置关系进行提示。
3.按照权利要求1所述的方法,其特征是对汉字的字根组件之间的各种相对位置关系归纳分类,形成字根位置码,插入到字根代码之间对字根的位置关系进行提示。
4.按照权利要求1所述的方法,其特征是对汉字的笔画组件和字根组件之间的各种相对位置关系归纳分类,形成笔画位置码和字根位置码,分别插入到笔画代码和字根代码之间对笔画和字根的位置关系进行提示。
5.按照权利要求2所述的方法,其特征是将汉字笔画分为横、竖、撇、捺、折五类,将汉字笔画的位置关系分为向下、向右、交叉、向上、向左五种,图1,按照键位个数安排代码,可以为每种笔位定义一个键位,或向下、向左共用一键,向右、向上共用一键,图3、4、5。
6.按照权利要求3所述的方法,其特征是将汉字笔画分为横、竖、撇、捺、折五类,将汉字字根的位置关系分为向下、向右、包含、向上、向左五种,图2,按照键位个数安排代码,可以为每种根位定义一个键位,或向下、向左共用一键,向右、向上共用一键,图6、7、8。
7.按照权利要求4所述的方法,其特征是将汉字笔画分为横、竖、撇、捺、折五类,将汉字笔画的位置关系分为向下、向右、交叉、向上、向左五种,图1,将汉字字根的位置关系分为向下向右、包含、向上、向左五种,图2,按照键位个数安排代码,可以为每种笔位、根位定义一个键位,或向下、向左共用一键,向右、向上共用一键,图9、10。
8.按照前述权利要求1-7所述的方法,其特征是使用笔画代码表示字根,按照字根频度特征,进行简码处理。
9.按照前述权利要求1-8的任何一条,对汉字进行编码的方法,可以应用到一切普通键盘、非标准键盘、屏幕软键盘、手写输入板、数字化仪、触摸屏等等用于采集、记录、传感、输入、通讯空间位置信息的设备,对汉字以及其它文字符号进行输入。
全文摘要
推广型林码汉字输入方法把汉字拆分成组件,对组件编码,同时归纳分类组件之间的位置关系,对位置关系编码,按书写顺序排列组件代码,然后把组件之间的位置代码插入其中,从而形成整字编码。发明可以完全对汉字的书写过程进行模拟,易学、规范,使用位置代码旨在降低重码率,再通过利用简码可以达到较高的效率。
文档编号G06F3/023GK1186271SQ9611410
公开日1998年7月1日 申请日期1996年12月23日 优先权日1996年12月23日
发明者林兵 申请人:林兵
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1