基于笔画矢量的汉字输入法及其键盘的制作方法

文档序号:6416833阅读:270来源:国知局
专利名称:基于笔画矢量的汉字输入法及其键盘的制作方法
技术领域
本发明涉及一种计算机汉字输入法及其键盘。汉字输入法很多,但各种方法仍没能根本解决其基本缺陷,如汉字拼音、语音识别输入法存在着同音字多、重码率高、输入低效和方言等问题;手写输入法存在识别率和书写速度慢的问题;而形码输入法虽没有上述缺点,但目前主流方案存在部件太多、取码规则复杂、难学难记和部件拆分歧义性等问题。本发明的目的是提供一种易学易记、通用规范和输入高效的汉字形码输入法,以适应广大计算机和信息通讯产品用户的需求。
本发明是按下述理论和方法实现的本发明汉字笔画矢量理论本发明根据汉字笔画的矢量特征,创建了汉字笔画矢量理论。笔画(stroke)是构成楷书汉字字形的最小连笔单位,或者说笔画是书写汉字时,一次写成的一个连续不断的线段。落笔处为笔画的起点,提笔处为笔画的终点。汉字笔画的矢量特征包括笔画方向和笔画长短两个方面。通过对成千上万个汉字进行分析,只考虑笔画书写方向,而不计其长短时,可以把汉字笔画方向归纳为七个基本方向,即上、下、右、右上、右下、左上、左下,以此建立起汉字笔画矢量坐标系,即附

图1。在附图1中,本发明根据七个基本方向把汉字笔画进行了归纳分类。根据汉字笔画矢量特征和七个基本方向,可以把汉字笔画分为单向笔画和复向笔画二种单向笔画是书写时其基本方向不变的单一笔画;复向笔画是书写时其基本方向改变的单一笔画。
本发明单笔和复笔的定义和选取;单向笔画有11种表现笔形,本发明归纳为6种基本笔形,并定义为“单笔”予以选取。
单笔是本发明选取的单向笔画的6种基本笔形,即(1)横一(2)竖丨(3)撇丿(4)捺(5)提 (6)点丶。
复向笔画有30种表现笔形,本发明归纳为20种基本笔形,并定义为“复笔”予以选取。
复笔是本发明选取的复向笔画的20种基本笔形,即(1)横斜钩 (2)横竖弯 (3)横竖弯钩 (4)横竖提 (5)横钩 (6)横撇 (7)横竖(8)横竖钩 (9)横折弯钩 (10)横折折撇 (11)撇点 (12)撇提 (13)弯钩 (14)竖横钩 (15)竖横竖钩 (16)竖钩(17)竖弯钩 (18)竖横(19)竖提 (20)斜钩 。
本发明部件的定义和选取汉字部件(Chinese character component)指由笔画组成的具有组配汉字功能的构字单元。
部件是本发明选取的52个常用汉字部件,即(1)木(2)艹(3)土(4)扌(5)王(6)大(7)石(8)雨(9)酉(10)寸(11)皿(12)罒(13)足(14)巾(15)虫(16)口(17)日(18)贝(19)山(20)田(21)鱼(22)攵(23)鸟(24)隹(25)犭(26)夂(27)夕(28)钅(29)月(30)竹(31)门(32)方(33)广(34)火(35)忄(36)氵(37)宀(38)米(39)衤(40)心(41)广(42)辶(43)弓(44)马(45)彐(46)尸(47)幺(48)纟(49)羽(50)女(51)小(52)子。
本发明计算机通用键盘和码元键位总图本发明使用计算机通用键盘,在键盘中26个英文字母键位上科学的对应分布选取的单笔、复笔和部件;若将选取的单笔、复笔和部件当作对汉字编码的码元单位,那么键位上26个英文字母即为码元。本发明的码元单位共计78个,即6个单笔、20个复笔和52个部件;码元为26个英文字母。本发明码元单位和码元的对应分布构成本发明的码元键位总图,即附图2。码元键位总图是本发明二级部件码的码元键位图,同时包含本发明笔画码和一级部件码的码元键位图,下面分别予以说明本发明笔画码、一级部件码和二级部件码笔画码是本发明根据选取的单笔和复笔对汉字进行编码输入的方法。
本发明选取的6个单笔和20个复笔对应的26个英文字母码元,构成本发明笔画码的码元键位图,即附图3,现说明如下一.6个单笔分别对应的6个码元键位(箭头→表示对应关系,下同)横一→F,竖丨→J,撇丿→D,捺→K,提 →G,点丶→H。
二.20个复笔分组对应的20个码元键位第1组是起始方向为横(左)且逆时针转向的复笔4个横斜钩 →Q,横竖弯 →W,横竖弯钩 →E,横竖提 →R第2组是起始方向为横(左)且顺时针转向的复笔6个横钩 →T,横撇 →Y,横竖→U,横竖钩 →I,横折弯钩 →O,横折折撇 →P第3组是起始方向为撇(左下)且逆时针转向的复笔2个撇点 →A,撇提 →S第4组是起始方向为捺(右下)的复笔2个弯钩 →L,斜钩 →M第5组是起始方向为竖(下)且顺时针转向的复笔3个竖横钩 →Z,竖横竖钩 →X,竖钩→C第6组是起始方向为竖(下)且逆时针转向的复笔3个竖弯钩 →V,竖横→B,竖提 →N。
一级部件码是本发明根据选取的单笔、复笔和26个部件对汉字进行编码输入的方法。
本发明选取的6个单笔、20个复笔和26个部件对应的26个英文字母码元,构成一级部件码的码元键位图,即附图4,其中单笔和复笔对应的码元键位与笔画码一样,现说明26个部件分组对应的26个码元键位第1组是起笔为横的部件5个王→Q,土→W,艹→E,木→R,扌→T;第2组是起笔为竖的部件5个山→Y,口→U,日→I,虫→O,贝→P;第3组是起笔为撇的部件5个隹→A,夂→S,月→D,钅→F,竹→G;第4组是起笔为点的部件6个火→H,氵→J,宀→K,辶→L,忄→M,心→N;第5组是起笔为复笔的部件5个马→Z,尸→X,纟→C,女→V,子→B。
二级部件码是本发明根据选取的单笔、复笔和52个部件对汉字进行编码输入的方法。
本发明选取的6个单笔、20个复笔和52个部件对应的26个英文字母码元,构成二级部件码的码元键位图,即附图2,二级部件码比一级部件码新增加26个部件,现说明新增加的26个部件分组对应的26个码元键位第1组是起笔为横的部件5个大→Q,石→W,寸→E,雨→R,酉→T;第2组是起笔为竖的部件5个巾→Y,皿→U,罒→I,足→O,田→P;第3组是起笔为撇的部件5个鸟→A,犭→S,夕→D,鱼→F,攵→G;第4组是起笔为点的部件6个门→H,方→J,米→K,衤→L,广→M,疒→N;第5组是起笔为复笔的部件5个弓→Z,彐→X,幺→C,羽→V,小→B。
本发明编码规则一.编码原则1.以选取的6个单笔、20个复笔和52个部件作为汉字编码的基本码元单位;2.按照汉字的规范笔顺进行码元单位的拆分和排序;3.部件拆分时取大取整。
4.语音提示规则本发明编码输入汉字时,计算机根据汉字的唯一编码、连续编码和重复编码,可以发音提示并读出汉字。
二.笔画码的取码规则1.以选取的6个单笔和20个复笔作为编码的基本码元单位;2.不定码长,按汉字规范笔顺取码,根据计算机提示音选取汉字并结束取码;3.取码出现唯一编码时,计算机发音提示并读出汉字,空格等方法选取汉字;4.取码出现连续编码时,计算机逐一读出汉字,空格等方法选取汉字;5.取码出现重复编码时,计算机发音提示并读出汉字,空格等方法选取汉字。
三.一级部件码的取码规则1.以选取的6个单笔、20个复笔和26个部件作为编码的基本码元单位;2.不定码长,按汉字笔顺取码,根据计算机提示音选取汉字并结束取码;3.取码出现唯一编码、连续编码和重复编码时,取码规则同笔画码一样。
四.二级部件码的取码规则1.以选取的6个单笔、20个复笔和52个部件作为编码的基本码元单位;2.不定码长,按汉字笔顺取码,根据计算机提示音选取汉字并结束取码;3.取码出现唯一编码、连续编码和重复编码时,取码规则同笔画码一样。
本发明编码功能一.组合编码功能本发明编码输入汉字时,可以单选和合选使用笔画码、一级部件码或二级部件码,并可相互切换。
二.跟踪显示功能本发明编码输入汉字时,屏幕显示栏内跟踪显示笔画、部件和汉字。
三.查询帮助功能本发明设帮助键?,在编码遇到困难时,可检索需要的汉字。
本发明特点一.易学易记,可广泛普及。本发明码元单位共计78个,从笔画码、一级部件码至二级部件码,循序渐进,无需死记硬背,据测试,初始输入约1000字,可自然牢记,再难遗忘;本发明编码规则完全根据汉字最基本的信息特征予以制定,没有人为规定和特殊例外,编码简便易学,可广泛普及。
二.通用规范,适合基础教育和行业需求。本发明所选取的单笔、复笔和部件,是小学生必须掌握的基础识字知识,完全符合通用规范性;本发明编码规则符合汉字规范笔顺和汉字自然具备的信息特征,适合基础教育和各行业需求。
三.高效输入,实现盲打。本发明码元单位少,易学易记,编码规则通用规范;并通过语音提示规则,将汉字形码输入和语音反馈交互式的给合起来,极大的降低了平均码长,实现高效盲打输入。
四.看打和想打通用。本发明笔画码适用于想打方式,部件码适用于看打方式;并通过语音提示规则,切合输入时语音创作思路,促进掌握汉字读音和普通话推广,实现看打和想打通用。
五.专业和非专业通用。非专业用户适用笔画码,专业用户适用部件码;通过组合编码功能,实现专业和非专业通用。
六.直接输入,界面直观。本发明通过跟踪显示功能,屏幕跟踪显示笔画、部件和汉字,具有西文直接输入特点,汉字输入界面直观友好,是汉字输入方式的新突破。
本发明基本思路笔画是构成汉字的最基本单位,汉字形码输入研究应立足笔画,但不局限于笔画;根据笔画对汉字编码,因汉字平均笔画数超过十个,制约了输入速度;根据部件对汉字编码,因部件分布率太低,需增设大量部件,造成难学难记和部件拆分歧义性的痼疾。因此,形码输入研究应将笔画和部件结合起来。观察发现,现今汉字形码输入方案基本上忽略了笔画的矢量特征,即复向笔画的方向性,粗略的将此重要信息特征简单处理为折笔、左折、右折等。因此,本发明认为有必要就复向笔画的方向性作深入研究,充分挖掘出其中的汉字信息特征,为形码输入研究探索并创建新的方法和技术。本发明充分利用复向笔画、少量部件等汉字最基本自然的信息特征,成功的对成千上万个汉字进行编码,使本发明的形码输入方法实现了易学、通用和高效的目的,从根本上突破了汉字输入法的专业和非专业界限,为计算机普及和教育开创了新途径。
本发明编码例字汉字 笔画码 一级部件码 二级部件码基 FJJFFFK EFFFDKW EFFFDKW于 FFC FFC FFC笔 DFHDFHDFFGDFFVGDFFV画 FJUFJF FPBJ FPBJ矢 DFFDKDFFDKDFQ量 JUFFFJUFFJ IFIJFF IFIJFF的 DJUFFDI DIDIHDIDIH汉 HHGYKJYK JYK字 HHTT KB KB输 FSJGDKFJ FSJGDKFD FSJGDKFD入 DK DK DK法 HHGFJFSH JWS JWS及 DP DP DP其 FJJFFFDH DFFFDH DFFFDH键 DFFFNUFFFFUFF FUFF盘 DDIHFHJ DDIHFHJ DDIHFHI注释本发明的码元键位总图,即附图2,是本发明关键性图表,现指定并提供。
权利要求
1.一种汉字形码输入法,其特征在于根据汉字笔画的矢量理论所选取的汉字6个单笔、20个复笔和52个部件,并分布在计算机通用键盘中的26个英文字母码元键位上,从而形成最能说明本发明技术特征的码元键位总图,即附图2;其特征在于首创的语音提示规则,将汉字形码输入和语音反馈交互式的给合起来,应用到本发明编码规则中,即;编码输入汉字时,不定码长,按汉字规范笔顺取码;取码时,计算机根据汉字的唯一编码、连续编码和重复编码,发音提示并读出汉字,空格等方法选取汉字。
2.根据权力要求1所述汉字输入法,其特征在于根据汉字笔画的矢量特征,科学创建的汉字笔画矢量理论,发现了汉字笔画的七个基本方向,即上、下、右、右上、右下、左上、左下,以此建立起汉字笔画矢量坐标系,即附图1,挖掘出汉字复向笔画的重要信息特征。
3.根据权力要求1至2项所述汉字输入法及所设计的键盘,其特征在于根据汉字笔画矢量理论和七个基本方向,将复向笔画归纳为20种基本笔形,并定义为“复笔”予以选取,即;(1)横钩 (2)横撇 (3)横竖(4)横竖钩 (5)横折折撇 (6)横折弯钩 (7)横竖提 (8)横竖弯 (9)横竖弯钩 (10)横斜钩 (11)竖提 (12)竖横(13)竖弯钩 (14)竖钩 (15)竖横钩 (16)竖横竖钩 (17)撇提 (18)撇点 (19)弯钩 (20)斜钩 ;其特征在于将选取的汉字20个复笔分为6个组合,并分组对应在20个码元键位上,即;第1组是起始方向为横(左)且逆时针转向的复笔4个横斜钩 →Q,横竖弯 →W,横竖弯钩 →E,横竖提 →R;第2组是起始方向为横(左)且顺时针转向的复笔6个横钩 →T,横撇 →Y,横竖→U,横竖钩 →I,横折弯钩 →O,横折折撇 →P;第3组是起始方向为撇(左下)且逆时针转向的复笔2个撇点 →A,撇提 →S;第4组是起始方向为捺(右下)的复笔2个弯钩 →L,斜钩 →M;第5组是起始方向为竖(下)且顺时针转向的复笔3个竖横钩 →Z,竖横竖钩 →X,竖钩→C;第6组是起始方向为竖(下)且逆时针转向的复笔3个竖弯钩 →V,竖横→B,竖提 →N。
4.根据权力要求1至3项所述汉字输入法及所设计的键盘,其特征在于根据汉字笔画的矢量理论和七个基本方向,将单向笔画归纳为6种基本笔形,并定义为“单笔”予以选取,即(1)横一(2)竖丨(3)撇丿(4)捺(5)提 (6)点丶;其特征在于将6个单笔对应在6个码元键位上,即横一→F,竖丨→J,撇丿→D,捺→K,提 →G,点丶→H。
5.根据权力要求1至4项所述汉字输入法及所设计的键盘,其特征在于根据汉字部件的构造特点选取的52个汉字部件,即(1)木(2)艹(3)土(4)扌(5)王(6)大(7)石(8)雨(9)酉(10)寸(11)皿(12)罒(13)足(14)巾(15)门(16)口(17)日(18)虫(19)方(20)贝(21)山(22)田(22)鸟(24)隹(25)犭(26)夂(27)夕(28)钅(29)月(30)竹(31)鱼(32)攵(33)广(34)火(35)忄(36)氵(37)宀(38)米(39)衤(40)心(41)广(42)辶(43)弓(44)马(45)彐(46)尸(47)幺(48)纟(49)羽(50)女(51)小(52)子;其特征在于将52个汉字部件分为一级部件码和二级部件码相互组合,分组对应分布在26个英文字母码元键位上,其中一级部件码的26个部件分组对应26个码元键位为;第1组是起笔为横的部件5个王→Q,土→W,艹→E,木→R,扌→T;第2组是起笔为竖的部件5个山→Y,口→U,日→I,虫→O,贝→P;第3组是起笔为撇的部件5个隹→A,夂→S,月→D,钅→F,竹→G;第4组是起笔为点的部件6个火→H,氵→J,宀→K,辶→L,忄→M,心→N;第5组是起笔为复笔的部件5个马→Z,尸→X,纟→C,女→V,子→B;其中二级部件码在一级部件码基础上新增26个部件,其分组对应的26个码元键位为第1组是起笔为横的部件5个大→Q,石→W,寸→E,雨→R,酉→T;第2组是起笔为竖的部件5个巾→Y,皿→U,罒→I,足→O,田→P;第3组是起笔为撇的部件5个鸟→A,犭→S,夕→D,鱼→F,攵→G;第4组是起笔为点的部件6个门→H,方→J,米→K,衤→L,广→M,疒→N;第5组是起笔为复笔的部件5个弓→Z,彐→X,幺→C,羽→V,小→B。
6.根据权力要求1至5项所述汉字输入法及所设计的键盘,其特征在于对计算机通用键盘中的26个英文字母码元键位划分的5个区域,即(1)横区码元为QWERT,(2)竖区码元为YUIOP,(3)撇区码元为ASDFG,(4)点区码元为HJKLMN,(5)复笔区码元为ZXCVB;并将选取的52个部件按起始笔画科学合理的分布在这5个码元区域内。
7.根据权力要求1至6项所述汉字输入法及所设计的键盘,其特征在于首创的组合编码功能,即本发明编码输入汉字时,可单选、合选和切换使用笔画码、一级部件码或二级部件码。
8.根据权力要求1至7项所述汉字输入法及所设计的键盘,其特征在于首创的跟踪显示功能,即本发明编码输入汉字时,屏幕显示栏内跟踪显示笔画、部件和汉字。
9.根据权力要求1至8项所述汉字输入法、所设计的键盘和码元键位总图,其特征在于当计算机通用键盘中26个英文字母码元键位,所对应的汉字单笔、复笔和部件及其组合分组稍有变更,或编码规则有变动,将得到相应的新对应关系的码元键位图。
10.根据权力要求1至9项所述汉字输入法及所设计的键盘,其特征在于以所选取的单笔、复笔和部件,替代台湾、香港、澳门及海外华人常用汉字,以及朝鲜用汉字、日本用汉字中的等形、形状近似或同义的单笔、复笔和部件,实现相应的汉字输入。
全文摘要
本发明是一种易学、通用和高效的汉字形码输入法及其键盘。根据汉字笔画矢量特征,创建汉字笔画矢量理论;选取26至78个码元单位,使用通用键盘中26个英文字母码元,设计了码元键位总图;首创语音提示规则、组合编码功能和跟踪显示功能,降低了平均码长,将汉字形码输入和语音反馈交互式给合,切合输入思路,界面友好,实现看打和想打、专业和非专业通用;编码规则符合规范笔顺,广泛适用于普及、教育和各行业计算机用户。
文档编号G06F3/023GK1304076SQ9911567
公开日2001年7月18日 申请日期1999年12月2日 优先权日1999年12月2日
发明者李铁 申请人:李铁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1