一种计算机类形码汉字键盘技术的制作方法

文档序号:6614916阅读:111来源:国知局
专利名称:一种计算机类形码汉字键盘技术的制作方法
技术领域
本发明涉及一种汉字输入方法,特别是指一种计算机类形码汉字键盘技术,属于中文信息领域。
背景技术
在用的汉字输入方法主要有拼音、拆字、笔画三类,拼音法因为采用现成的汉语拼音作为编码元素且因其与电脑键盘上的英文字母正好契合,以所谓的零记忆,不用专门学习的优势而拥有大量的使用者,其致命弱点是单字析出率太低,不能直接打出所需的字,只能找,随着电子设备容量的不断增大,程序编制技术的日益进步,强大的搜索和定位功能,加之大企业、大资金的投入,使得打词、打句的设想变为现实,拼音打字变得简单容易,但严格讲它不是真正的汉字编码,打的是“音”不是“字”,而音是为口腔设计的,笔画才是掌手的用武之地,写字才是掌手的功能之重,它既没有在打字的过程中锻练发音,也没有提高手写 的能力,长期使用,必然“音”、“画”皆失,目前社会上(尤其是在中小学生中)日益严重的书写无能与书写失忆的通病,与此不无关系。拆字(字根)法提高了编码的聚合度,缩减了码串的长度,大量的编码方案属此类,使打字的速度得以加快,但其识别度并没有相应提高,也因此无法解决重码问题,只能依靠区别码、识别码、小码、尾码、加码之类的方式来提高识别度,使节约的击键次数和时间又还了回去,无形中还增加了记忆负担,而且打字的过程中还要不断地思考怎么拆?什么字根?在什么位置?出字后待屏又是什么编号?用不用翻页?等等,用这种方法打字,总让人觉得不从识字阶段的小学时期开始,实难全面掌握,是它的先天缺陷;另外从规范角度讲在用的字根表类几乎都存在不合规的问题,国标规范部件五百多个,如果没有自定规则实际上是没有什么使用价值的;再则拆字(字根)法的前提是把汉字分成两大块,能拆则拆,不能拆的则用其它的方法处理,事实上它是用两套方法在打字,必然是两种思维方式,再加上拆与不拆的分辨,使打字变成了复杂的脑力活动,且思维繁杂,长期坚持使用尚可,若有间断,则多半会遗忘,大都无法兼顾处理易学、高效、科学的矛盾。笔画(首尾)法的好处在于依笔顺书写顺序,作为编码的序性依据,简单易学,这一点是值得肯定,但对汉字的结构特性稍有了解的人都清楚,在用的“首三尾一”方案有先天缺陷而难以提高效率,且无法去除众多的重码,在不改变规则的前提下,那怕是“首十二尾一”也无法彻底去除一码多义。是坚持不厌其烦地去找字,还是寻求一种更完美的汉字编码,是一种选择,也是一种无奈,无论如何作为传承数千年不变、不断的符号体系,在面临信息时代的新局面,需要一套完整的以组成汉字的基本单位(笔画)为基本编码元素的编码体系,以适应机器辨识的需要,这是无疑的。码兀最小;码串最短;记量最少;规则最简。是汉字编码的最闻追求,一码多义是任何编码的极忌,在汉字编码中表现的就是一码多字(重码),解决不了重码的方案不能说是好方案。汉字编码已经走过了三十多年,也已经混乱了三十多年,虽然方案数千,但终无扛鼎之作,政府缺位是主因,把文字这样涉及民族传承、文化血脉的要务轻易交给市场,是缺乏责任感的行为,记得多年前有专家曾预言随着信息化的到来,汉字的规范将得到加速,可惜现实正相反。公认的现实趋向是重编程轻编码,编程和智能的确可以使“汉字进入计算机”这一过程有了很多便捷之法,但说到底这只是一种辅助之法,不能解决本质问题,好的输入方案应该在编码设计阶段就赐除掉与文字输入本身无关的任何附赘,一种能够在不同键位的键盘上,采用同一编码方案的输入方法亟待出现,也就是人们渴望已久的汉字“通用编码”,它所担负的责任和意义不仅是“把汉字弄进机器中”这样简单的操作技术层面,而是关乎汉字字符集(字库)的编建,中文信息化,网络传输等的提升,在期盼已久的中文操作系统无法短期出壳的情况下,也只能寄望于编码的提高来弥补之
发明内容

本发明的设计思想是让书写与录入融入一体、使运笔与击键相辅相成。本发明的实现路径是一字一个编码、一字编码唯一。本发明的最终目的是实现汉字无字根、无编码、无字库输入,真正使人机高度融合,使中文识字教育符合现代信息化需求,让读、写、录三结合同步教学,音、形、码一次掌握,彻底改变无纸办公时代愈演愈烈的全民书写失忆,这一社会通病。I、本发明的理论支撑,如权利要求1、2所述,一种计算机类形码汉字键盘技术,其特征在于
本发明是建立在严谨的数字统计、严密的数据计算、严格的结构分析基础之上,选择当前正在使用的一万个汉字作为样本和数据来源,对笔画、笔画结构、笔画相邻、笔画相交、笔画重复、笔画连接、笔画位置、笔画变异、笔画演变等项进行深入探讨和精确的数据统计;对笔画进行分析可以发现一些带有普遍和规律性的现象即由笔画组成汉字的过程,就是笔画的相邻、相交、重复、相连的不断组合。笔画利用率笔画的组字参与度,建立这个概念的目的在于重新认识笔画在编码中的作用。笔画编码利用率笔画作为编码元素进入码串的次数。入字度笔画在一字中出现的数量(入字度高的笔画其编码离散度低,反之入字度低的笔画编码离散度高)。入字率笔画在文字中出现的次数(入字率高的笔画其编码区别度低,反之则高)。入码度笔画在一字编码中出现的数量,即笔画被用来作为编码元素的次数(入码度高的笔画其编码离散度低,反之则高)。入码率笔画在编码中出现的次数(入码率高的笔画其编码区别度低,反之则高)。重复率笔画在组字时连续出现在同一位置的几率,双重、三重、四重的都有,重复结构对编码十分不利,如果两个字中出现相同的笔画重复结构,会使码串变的很长,如不采取措施,重码不可避免,重复结构在文字中出现的频率还是很高的,好在重复的范围不大,仅有6个笔画(横、竖、撇、点、撇折横、撇折点)有重复现象;还有一种重复现象也很普遍,就是笔画结构(部件)的重复,它也是编码的一个难题,也应引起重视;相同的笔画(撇与撇)首尾相连也以重复论之。
入字,是先天存在,是客观,是条件,不可变更,但有其内在的规律性。入码,是后天人为,是主观,是设计,可发现和提高、用利避弊。总之文字是既成事实,是我们无法改变的,笔画入字度平衡是编码均衡的前提,笔画入字率平衡是编码离散的前提,可惜这两个条件均不具备,这是汉字给我们出的一道难题,我们能做的就只有精确统计出笔画的入字度和入字率,并且从中找出一些可资利用的规律和可资借鉴的编码素材,我们可以大有作为的是在入码度和入码率的利用上,通过改变笔画的入码率来达到无重码、通过调整入码率使笔画的入码度趋于均衡,让入字度高的笔画尽量少入码串,让入字度低的笔画尽量多地进入码串,籍此提高码识别度,从而实现减少码元、压缩码长、杜绝重码的至尚至美的境界。粗略的数字统计分析结果显示
撇笔画的入字率高,横笔画的入字度高;横笔画的相交结构和重复结构都很多,撇笔画次之;这对于如何解决码离散和码聚合问题有重要的参考作用。 汉字从产生、发展、演变到逐渐完善,受到过无数的冲击和改造,与战争、灾害、权力、外域文化、外来干涉等进行过难以计数的磨砺和嬗变,以至于成为独特的完整的构造体系,都与机器无关,而信息化时代的网络传输、机器识别、存储、显示系统等,又不是专为汉字设计的,所以使得汉字的录入才显得先天不足,汉字不为电脑而生,电脑不为汉字而存(设计),问题的根源在此。有了上述理论的支持,运用在编码中必定会有良效。2、本发明是一种计算机类形码汉字键盘技术,可以在各种不同键位的键盘上用同一编码输入汉字,如权利要求3所述其特征是
以笔画的本质属性为依据把笔画分为三类
横类笔画横、提、横钩、横起笔的折笔画共15个;
竖类笔画竖、竖钩、竖起笔的折笔画共9个;
斜类笔画撇、点、捺、撇钩、捺钩、撇起笔的折笔画共7个。这是对笔画的归类整理,把笔画依本身特性进行分类,使为数众多(31个)的笔画类分为三,便于键位的分布和安排;斜类笔画概念的提出,是因为横、竖两笔画都有大量的折笔画可以很自然地填补其键位上的码素不足和平衡键位内容,而撇笔画虽然有大量的组字参与和很高的入字率,但撇起笔的折笔画却很少,只有两个,加之捺、点两笔画在组字过程中变异频繁,且捺笔画入字度和入字率都极低,把它们归为一类,放在一个键位上,更有利于键位布局和码素调整,是均衡键位字数分布和键位内容分布的有效措施,对于压缩码长和消灭重码也有积极意义。3、本发明是一种计算机类形码汉字键盘技术,如权利要求4所述其特征是 以笔画的结构属性为依据把笔画分为三形
单形笔画独立存在于字中的笔画;
复形笔画相同位置重复出现的笔画;
双构重,表示相同的笔画结构在一字中重复出现两次以上(林、炎、品、叕等);
交形笔画笔画穿过另外的笔画形成交叉点的笔画结构;
单交笔画与笔画相交为单交;
连交笔画与多个笔画连续相交为连交。
在笔画分类的基础上,对笔画进更进一步的分形,为下一步对笔画的精确编码打下基础。把复形和交形笔画结构看作为有机整体给予编码,以便于减短码串长度,是个有效办法。4、如权利要求5所述的一种计算机类形码汉字键盘技术,其特征在于
以笔画的向度与耦合属性为依据把笔画分为三个位价
主笔画基本笔画,不改变运笔方向的笔画(横、提、竖、撇、点、捺共6个);
辅笔画折笔画,改变运笔方向的笔画(横钩、横起笔的折、竖钩、竖起笔的折、撇钩、捺钩、撇起笔的折共25个); 笔画体笔顺相连、形状固定、无重复、不相交的笔画组合;经过严格筛选、严密计算,与组字频度的比对,本发明选定10个;
笔画体变异与笔画在不同的字中和在字中的不同位置上发生变化一样,笔画体中的笔画当处于不同位置时也在变化(止字下面的横,在作为部首时变为提,在足字中则变成了捺);
笔画体系列笔画体增加或减少一笔画所形成的一组相近或相似的笔画体(高头、广
字、病字头等)。通过对笔画的分类和分形,已经足以应付编码所需,再加上笔画的主辅之分,便能满足和加深我们对笔画的解析,因为对笔画的分类和分形是我们对笔画的客观存在的认识,对笔画的主辅之分则是我们对笔画的主观认识,也是我们对笔画的理解由静态变为了动态,使击键操作与运笔操作有了一定的关联。如果我们换一个角度来看的话,主笔画的入字度和入字率都要高于辅笔画,所以在实际使用中,主笔画所在的键的搡作频率远高于辅笔画所在的键,而辅笔画大多是以单笔画参与组字,所以其编码区别度相当高,也因此是解决重码问题的中坚力量。对于笔画体的甄别与选择,严格按照组字参与度高(八字系列、高头系列)和笔顺不易辨认(万字、脊字)两项原则;需要特别说明的是笔画体是全新的概念,有着准确的定义范畴;它与部首(偏旁)不同,部首(偏旁)有准确的意函指向,笔画体只是笔画的顺序组合,无文字学意义上的任何意函;它与字根也有本质的区别,字根是对汉字的无理拆解,字根的数量越多,其无理性也越强,笔画体是对笔画顺序、结构的规律总结,选取与界定它是一件非常复杂繁縟且无任何借鉴参考的创新工作,选多了记忆量增大不说,也给键位布局带来麻烦,选少了则不能有效解决重码问题。本发明首次提出了笔画体的概念,从表面上看好象只是把两笔(多笔)画合一取码而已,但实际上由于它们的组字参与度极高,也就是说在大多数字中都有它们的存在,所以说对于调整键位字数和码素位置的作用是巨大的,虽然粗看似乎感觉增添了记忆量,但它所带来的压缩码长的威力是意想不到的,综合多方面因素的考虑肯定是利大于弊,是值得的;另外就是重复和交叉结构分别作为整体取码以后,使码串的综合质量已趋完美,但仍有一些小的遗憾就是汉字中存在的大量的无重复、不交叉的笔画群体有些字甚至二十多画而无重复且不相交,它们仍然影响着相当一部分字的编码质量和码串长度,还有些笔画群的笔顺往往很难准确熟练地掌握,如竖心、万字、脊字头等,正是基于上述原因,经过无数次的考证筛选,才提出了建立笔画体这一全新的概念,有了它直接为一些三四十笔画的复杂汉字的编码找到了一条捷径,且与原有规则和汉字的传统认知习惯不发生大的冲突,整体检验不失为一种可行有效的尝试,实际结果令人满意,虽然最后只选择了十个(组)笔画组合,但对于编码效率的提高是具有倍数效应的。5、如权利要求6所述的一种计算机类形码汉字键盘技术,其特征在于
依笔画在字中的自然状态不同对其进行编码
单笔画取一码;复笔画(含笔画结构重复)作为整体取一码;交笔画作为整体取一码(单交依笔顺取一码;连交取交叉点多的笔画一码);笔画体作为整体取一码。
权利要求
1.一种计算机类形码汉字键盘技术,其特征在于用一套编码在不同键位的键盘上输入汉字。
2.如权利要求I所述的一种计算机类形码汉字键盘技术,其特征在于 以汉字的笔画作为基本输入单元和编码元素;对笔画进行分析可以发现一些带有普遍和规律性的现象即由笔画组成汉字的过程,就是笔画的相邻、相交、重复的不断变化与组合; 入字度笔画在一字中出现的数量(入字度高的笔画其编码离散度低,反之入字度低的笔画编码离散度高); 入字率笔画在文字中出现的次数(入字率高的笔画其编码区别度低,反之则高);入码度笔画在一字编码中出现的数量,即笔画被用来作为编码元素的次数(入码度高的笔画其编码离散度低,反之则高); 入码率笔画在编码中出现的次数(入码率高的笔画其编码区别度低,反之则高)。
3.如权利要求2所述的一种计算机类形码汉字键盘技术,其特征在于 以笔画的本质属性为依据把笔画分为三类 横类笔画横、提、横钩、横起笔的折笔画共15个; 竖类笔画竖、竖钩、竖起笔的折笔画共9个; 斜类笔画撇、点、捺、撇钩、捺钩、撇起笔的折笔画共7个。
4.如权利要求3所述的一种计算机类形码汉字键盘技术,其特征在于 以笔画的结构属性为依据把笔画分为三形 单形笔画独立存在于字中的笔画; 复形笔画相同位置重复出现的笔画;双构重,笔画结构重复,表示相同的笔画结构在一字中重复出现两次以上(林、炎、品、叕等); 交形笔画笔画穿过另外的笔画形成交叉点的笔画结构; 单交笔画与笔画相交为单交; 连交笔画与多个笔画连续相交为连交。
5.如权利要求4所述的一种计算机类形码汉字键盘技术,其特征在于 以笔画的向度与耦合属性把笔画分为三个位价 主笔画基本笔画,不改变运笔方向的笔画(横、提、竖、撇、点、捺共6个); 辅笔画折笔画,改变运笔方向的笔画(横钩、横起笔的折、竖钩、竖起笔的折、撇钩、捺钩、撇起笔的折共25个); 笔画体笔顺相连、形状固定、无重复、不相交的笔画组合;经过严格筛选、严密计算,与组字频度的比对,本发明选定10个; 笔画体变异与笔画在不同的字中和在字中的不同位置上发生变化一样,笔画体中的笔画当处于不同位置时也在变化(止字下面的横,在作为部首时变为提,在足字中则变成了捺); 笔画体系列笔画体增加或减少一笔画所形成的一组相近或相似的笔画体(高头、广字、病字头等)。
6.如权利要求5所述的一种计算机类形码汉字键盘技术,其特征在于 依笔画在字中的自然状态不同对其进行编码单笔画取一码;复笔画(含笔画结构重复)作为整体取一码;交笔画作为整体取一码(单交依笔顺取一码;连交取交叉点多的笔画一码);笔画体作为整体取一码。
7.如权利要求6所述的一种计算机类形码汉字键盘技术,其特征在于 把汉字的笔画按特定规律分配在不不同的键位上,在不同键位的键盘上把笔画有规律的进行分配,笔画所占据的键位即为该笔画(含笔画结构)的编码,在数字键盘上显示为I-O十个数字;在字母键盘上显示为Q-M二十六个字母;在中文专用键盘上则为笔画的表示符; 在数字键盘上1-2-3键为横类笔画区、4-5-6键为竖类笔画区、7-8-9键为斜类笔画区、*-0-#键为符号口框区;竖向数1-4-7键为单笔画区、2-5-8键为复笔画区、3-6-9键为交笔画区;同时每个键位上都分配有三个位次的笔画一个主笔画、一个(组)辅笔画、一个(组)笔画体; 在字母键盘上第一行Q—P为笔画体区、第二行A—L为主笔画区、第三行Z—M为辅笔画区;在主笔画区里A-S-D横类笔画区、F-G-H为竖类笔画区、J-K-L为斜类笔画区;A-F-J为单笔画键、S-G-K为复笔画键、D-H-L为交笔画键;在笔画体区里每个键上分配一个(组)笔画体;在辅笔画区里每个键上分配一个(组)辅笔画; 在中文专用键盘上直接标出笔画表示符,直击码符即可输入,与英文输入相同,完全实现了中文输入的简单、轻松、自然。
8.如权利要求6、7所述的一种计算机类形码汉字键盘技术,其特征在于 依据编码规则和笔画键位分布,其取码方法是按照 编码+余码的顺序提取汉字的编码(单字编码在数字键盘上最长5码,在字母键盘上更短,一码字即[键名字]10个); 余码…重叠的笔画结构(部件)的首码和交、重结构剩余笔画的码; 余码只用在输完全部编码后仍出不来的少数字上,拆笔画时应先拆复形笔画结构,再拆交形笔画结构,最后拆笔画体;一字中同时有两个复形、交形结构和笔画体时,从后往前依笔顺拆;实际上这种情况很少出现。
9.功能键在成型产品上不改变其功能键设置,在中文专用键盘上定义了新型系列功能键;增位键在数字键盘上为〇键、在字母键盘上为Z键;是专为提高整套编码的操作效率而设置,其作用是把笔画少的冷僻字(乜、乂4、亍等)的编码加长,笔画多的冷僻字(齄、鼢)的编码减短,以让出优质码位给常用字,从而提高键盘操作效率。
10.打字以汉字书写笔顺为序,依次输入汉字的编码,所需的字出现时按确认键即可;输入词组或短句时在第一字出现时,不按确认键,继续输入第二、三……字的码,后面的字不需输完全码即可见字,且越靠后所需的码越少,减少击键次数,节约时间;依该技术设计思路,只要对多种文字的笔画定义作相应的映射改变,同样可以在日文、韩文、越文等文字中适用;若把笔画表示符作以数字化的技术处理,直接嵌入芯片中,配合相应的显示技术予以支持,人们期待已久的无字库汉字输入将有可能得以变为现实。
全文摘要
一种汉字输入方法,计算机类形码汉字键盘技术,主要特点是码元少、码串短、无重码,实现了一字一码,打字不找字,且易记难忘,规律性强;设计原理是以组成汉字的基本单位笔画为唯一编码元素,以其本质属性为依据,把笔画分为横、竖、斜三类;以其结构属性为依据,把笔画分为单、复、交三形;以其向度与耦合属性为依据,把笔画分为主、辅、体三位;依笔画在字中的自然状态进行编码,用一套编码可以在各种键位的键盘上完成汉字输入,是真正的汉字通用编码。
文档编号G06F3/023GK102902370SQ20121044077
公开日2013年1月30日 申请日期2012年11月4日 优先权日2012年11月4日
发明者狄碧晴, 狄铁超 申请人:狄碧晴, 狄铁超
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1