特征部件编码法及其键盘的制作方法

文档序号:6416808阅读:172来源:国知局
专利名称:特征部件编码法及其键盘的制作方法
技术领域
本发明属于汉字输入法及其键盘,特别是汉字部件编码法及其键盘。
在造字法中,汉字的基本构字要素是部件,也称字根。使用部件或字根进行汉字的编码是目前电脑汉字输入法的主流。但是,现有技术中普遍存在部件或字根的编码需大量记忆的缺陷,大多数编码方案都选用了数百个编码部件,并且有的技术还要求对部件取超过一个的编码,这些部件的编码记忆不仅缺乏规律性,而且取码思维与人认知部件的思维严重不符,从而导致输入法难学难用,严重制约了输入法的普及。另外,在个人电脑仍然大量使用于各个领域的情况下,手持电脑及通讯设备也得到越来越广泛的应用,这些设备中的汉字输入往往需要使用数字键盘,因此,信息技术的发展迫切需要一个同时适用于英文键盘和数字键盘的编码方案,而当前国内外的汉字输入法虽多,但能够真正实现英文键盘和数字键盘布局全面兼容的却一个也没有。
综上所述,本发明的目的在于彻底克服汉字输入方案中部件的编码需大量记忆的缺陷,并使取码思维与人脑认知部件的思维保持一致。本发明的目的还在于实现同一套部件编码体系对英文键盘和数字键盘的全面兼容,使需要同时使用英文键盘和数字键盘输入汉字的用户无须学习两种不同的输入法。
本发明基本内容包括一套可统率基本编码部件的特征部件体系,一种以特征部件统领基本编码部件为核心技术的符合《现代汉字通用字笔顺规范》及符合汉语言文字规范的部件编码方案,该方案同时适用于英文和数字键盘;一种基于特征部件的部件副码编码技术。
本发明中的特征部件又称字元或字根头,它们是一些笔划数较少的,带有典型造字特征的部件或笔划组合,如“八、一、二、七、十”等。对汉字中任一个部件,总是能够找到一个特征部件,使该部件的前几个笔划所组成的字形结构特征与这个特征部件相同或相似,如“夫”的前两个笔划组合为“二”、“木”前两个笔划可组合成“十”等等。因此,当对某特定的部件集合进行编码时,首先从中优选一定数量的特征部件,结合编码学的规律性、谐调性原则将它们分配到英文或数字键盘键位上,然后对每一个部件根据《现代汉字通用字笔顺规范》及汉语言文字规范分析其前几个笔划组成的字形结构特征,与之对应的特征部件的键位即为该部件的键位。本发明的核心技术便在于这种以特征部件统领基本编码部件的部件编码方案。其中,特定的部件集合可以是多个来源,如国家语委颁布的规范部件集合、形码方案中精选的部件集合等,甚至可以直接是某一字符集。本发明中特征部件的选取和键位分配较为关键。特征部件必须具有较强的代表性,能够统领较多的基本部件,特征部件的定位应最大程度符合易记性和谐调性原则。本发明中特征部件的选取可如附

图1所示,同时可根据符合规范、适合操作、减少重码等要求,做相应调整。本发明中特征部件的定位可有多种方法。例如作为本发明的一个实施例,特征部件可采用“象形编码法”定位。“象形编码法”是象形造字法在编码学的应用,其关键技术在于编码用的部件或字根与英文字母或数字的相似性或会意性。同时,象形定位也充分考虑到手指的谐调性原理,让使用较多的部件分配在操作较易的键位。本发明的象形编码法应用可以如附图1、2及3所示,其中的“象形特征”是用一句话来概括特征部件与字母或数字的象形或会意的特征,如“口”与O键的共同特征是“笑口常开”。本发明设置的特征部件皆为规范部件。
每个特征部件具体地应按排在哪个键位上,应以与字母或数字最大程度地象形或会意而不致牵强附会为准则,当然,本发明亦允许根据需要对一些特征部件的象形归类作变动,如可将“G”位的“厂”调整到“J”位。本发明对五种基本笔划以其声母分别归类在对应字母键位上。
本发明还可存在多种方法来安排特征部件的键位,如完全根据手指负荷原理安排键位、根据特征部件的声母与英文字母的对应性安排键位等等。
另外,在使用本发明得到基本编码部件键位的基础上,也允许对一些编码部件的特征部件归类作灵活变动,允许个别部件不严格按照其所包含的特征部件定位,而是根据需要硬性规定其英文或数字键盘键位。
本发明的另一特征在于特征部件的部件副码技术的创造性应用。部件副码技术是本发明人首创的一项部件编码技术,又称部件副码编码法。其要点是在部件原有的单个代码基础上额外添加一个或多于一个的代码,从而形成部件的多码体系。部件原有的代码称为部件的主码,额外添加的代码称为部件的副码。部件副码的使用既保证了部件不会被无理拆分,保证了部件的整体性和规范化,同时又在不增加取码思维难度和记忆难度的基础上加大了码长,使重码率降低在允许的范围内。但是,副码的数量必须小于最大码长,副码的键盘配置必须易学好记。根据这两个要求,本发明中得到部件副码的方法可以是在小于最大码长的基础上,基本编码部件按“取大优先”原则取出其笔划结构中包含的第一个特征部件作主码,其包含的第二个特征部件作为副码的第一代码,其包含的第三个特征部件为副码的第二代码,余下以此类推,直至取完为止,如部件“文”的主码为y、副码为x。由此得到的副码体系见字得码,无需记忆。当然,本发明也允许对一些部件的副码做出调整,如限制副码长度、灵活安排副码的取法、硬性规定部件的副码等。需要注意的是,使用特征部件得到部件副码并不是对部件进行二次拆分,而只是形成部件的多码体系的一种技术方案。这种方案对一个部件分配多于一个的编码,部件仍是原来的部件,与使用多个字母来表示一英文词汇是同样道理。
本发明可以采用电脑或手持设备的英文或数字键盘,在对应的字母或数字键位上,可以标识出特征部件、基本编码部件及部件副码,可以如附图1、2、3、4所示。其中附图1是本发明在“象形编码法”应用下的一种英文键盘布局实施例;其中附图2是本发明在“象形编码法”应用下的一种数字键盘布局实施例;附图3是本发明应用于本发明人另外发明创造的一种汉字输入法时的基本编码部件的键盘配置图本发明基于对汉字文化最高层次的感悟和对汉字造字法全面深刻的理解,广泛系统地分析研究了汉字固有的信息熵,最终提出的编码解决方案彻底征服了输入法特别是形码输入法中多项举世公认的难题,最终实现了以下多项编码技术的革新1.形码中部件的键位分配无须记忆,且取码思维与认知汉字的思维保持一致汉字输入法发展到今天,大致可分为形码、音码、音形码和流水码4种,各有其优缺点,谁也不能代替谁。其中,形码以其重码率低、速度快相对应用较多,但是形码的部件及其编码的记忆严重制约着形码的普及。一般用户在花费大量时间记忆后,如不经常使用,很快便忘得一干二净,“形码便是记忆”已成一致公认。本发明建立在造字法和认知心理学基础上,改写了形码需要记忆的历史。
认知的语言是图形语言,例如儿童对周围世界的认识最初总是源于万物在其大脑的图形映像。认知的心理在于首先把握事物的特征,然后逐步认识事物的一般和细节。例如认识一个人,我们首先记住的是他的身体特征,特别是他的脸部特征,接着再结合他的姓名年龄或性格等,便可确认是某某人。汉字是象形文字,其本质便是图形。图形汉字是由一个或数个部件组成的,所以部件本身也是图形。于是,对汉字编码的任务便集中于把握部件这种图形的特征上,而部件图形最典型的特征便在于部件前几个笔划所构成的字形结构特征。人在认知部件时,首先通过这种字形结构特征在人脑中形成部件的大体轮廓(也是图形),然后再结合部件的其他笔划进行确认。因此,科学地选取具有典型字形结构特征的部件作代表,将其他部件按前几笔划构成的字形结构特征与代表部件的相同性归类并分配在同一键位上,形成代表部件统率基本部件的编码体系,这种编码体系基于人的认知心理,使取码思维与认知部件的思维保持一致,大大加快了取码速度。更重要的是,这种编码体系使得编码部件的记忆锐减为少数几个代表部件即特征部件的记忆,记住了特征部件的键位也就同时记住了整个部件体系的键盘配置。那么应如何记忆这些特征部件呢 在造字法中,汉字的部件最初绝大多数是事物的象形或会意,借用这个原理到编码学中,根据与英文字母或数字的象形或会意性定位特征部件,特征部件的键位即为与其象形或会意的英文字母或数字的键位。因为特征部件的笔划数较少,所以与字母或数字的象形或会意决不会显得牵强附会,而是很自然地得到。如“口”为0键或哦O键;“人”为A键或8(八)键。由此,特征部件的键位无需强记,甚至不再需要区分特征部件与基本部件,当见到一个部件时,只需分析该部件的前几个笔划所构成的字形结构特征与哪个字母或数字象形或会意,这个字母或数字便是该部件的键位代码,从而真正实现了见字得码,实现了中国人几十年来梦寐以求的“无编码的编码”输入技术。
2.实现了取码拆分的规范化
以往的形码因设计方案无科学性,不但选用的部件与《部件规范》严重不符,取码时更是脱离笔顺规范任意拆分,从而不能与汉语言文字规范接轨,影响了中小学的文字教育。本发明使用特征部件统率基本编码部件,编码部件基于特征部件的归类严格遵循《现代汉字通用字笔顺规范》,如“长”字的特征部件应为“丿”而不是“七”。
3.使在英文和数字键盘上使用同一套部件编码体系成为可能后PC时代的到来,使手持设备得到广泛应用,为适应其体积小便于携带的特点,必须使用数字键盘输入汉字。另一方面,个人电脑依然大量使用于各个领域,信息技术的这种客观形势要求英文键盘与数字键盘并存。但是,能够使用数字键盘输入汉字的编码本就不多,而既适用于英文键盘又适用于数字键盘的规范化的编码方案更是绝无仅有,许多人不得不学习多个输入法,既浪费了宝贵的时间也带来汉字输入的诸多不便。本发明基于对汉字结构的独特认识和对造字法的深层理解,首次实现了部件体系对英文键盘和数字键盘的全面兼容,形成了由象形会意的数字键位统领象形会意的英文字母键位的严谨的编码体系。例如数字键“3”的会意义为“三分”,即部件的特征是前几个笔划由离散的三个相同笔划组成,如“丰川彡巛氵”等字的数字码皆为3;同时,数字键“3”又统领着英文字母健“M”和“E”,“M”的象形义是“三点”如“氵”,“E”的会意义是“三王分天下”包括除三点外的三分部件,如“王丰川彡巛”等。于是“王川”等字的数字码为3,而字母码为E。不难看出,本发明的这种部件体系从数字编码到字母编码或反之的转换形象直观,简单自然,丝毫不影响取码思维,亦不会增加记忆。并且,在允许最大码长为6的数字键盘实施例下,结合部件副码或识别码即可顺利完成GBK大字符集中20902个汉字的数字编码,这是其他任何一种输入法都无法比拟的。
4.有效地解决了部件副码的编码难题;有相当一些汉字仅由2-3个部件组成,取码时,码长短,重码多,如果使用“部件副码编码”技术,对一些部件分配一个以上的编码,便可以在保证部件不会被无理拆分,保证部件的整体性和规范化的基础上有效增大码长,降低重码。但是,部件副码必须以容易掌握、不额外添加记忆和不影响取码思维为前提。于是,如何确定部件的副码又成了新的编码难题。本发明使用特征部件对部件分配副码,由于特征部件是汉字固有的信息熵,编码部件可以看成是一个或一个以上的特征部件的自然组合,如“文”可看成是“亠”和“乂”两个特征部件的组合,因此,部件副码只需按汉字笔顺规范依次截取部件中包含的特征部件,这些特征部件的代码组合在一起便得到该部件的编码,第一个代码是部件的主码,其余的是部件的副码,最终得到的副码编码体系不仅自然直观、无须记忆,而且很好地解决了汉字中独体字的编码问题。
本发明彻底解除了部件编码的记忆烦恼,可广泛应用于各种形码输入方案中。在给出一特定的编码部件集合或字根集合甚至字符集后,使用本发明对部件或字根分配键盘键位,便可达到部件编码或部件副码的无须记忆、见字得码的效果。使用本发明,从此形码再也不须记忆,易学好用,便于普及。本发明还可应用于音码方案中,将使用本发明得到的部件编码或汉字编码置于汉字音码的前面或后面,即可在不增加记忆负担的基础上大大降低音码的重码率,提高输入速度。如在汉字的全拼码或双拼码之前或之后加上汉字所包含的第一个特征部件的代码,便可形成一种音形码方案,此方案可优秀于现有技术中任一音形码或形声码。
本发明突出的实质性特点在于科学地选取汉字部件中固有的信息熵-特征部件,根据编码学中易记性和谐调性原则科学地分配在英文或数字键盘布局中,并统率输入方案中特定的部件集合或字符集,最终形成的无须记忆、见字得码、取码思维与认知部件的思维完全同一的部件编码体系和部件副码编码体系。本发明将用户从编码记忆的重压下解放出来,为汉字输入法的真正普及铺平了道路。从此,汉字输入迈进了一个全新的时代,汉字文化必将更加发扬光大。
本发明显著的进步性在于划时代的编码方案-特征部件统率基本编码部件最终形成部件编码体系的技术使艰巨繁重的编码任务集中为少数几个特征部件的编码;基于特征部件的部件编码体系成为编码学史上第一个无须记忆,见字得码的部件编码体系;特征部件的“象形编码法”应用从造字法和认知心理学的高度使得部件取码思维与部件认知思维完全一致,并首次实现了英文、数字键盘布局的全面兼容;特征部件的应用第一次实现了GBK大字符集20902个汉字的数字键盘输入,开拓了手持设备汉字输入的广阔前景;基于特征部件形成的部件副码编码体系为汉字输入的规范化、降低重码、全面提高输入速度奠定了基础。
本发明以其高度的创造性在汉字输入领域开辟了广泛的应用前景,本发明的基本特征在于使用特征部件统领基本编码部件得到的同时适用于英文和数字键盘的部件编码体系及部件副码编码体系,为适应输入法个性化需求,符合科学性及规范化原则,本发明可通过以下诸项的调整来实现本发明的多个实施例1.使用特征部件进行编码的特定部件集合可以是多种集合甚至是字符集。
2.特征部件的选取可适当添加,减少或调整,如“”可不选用。
3.特征部件的定位方法可作调整,如既可使用“象形编码法”,也可完全根据谐调性分配键位。
4.使用“象形编码法”对特征部件的定位可作调整,如“八”可设置为“V”键。
5.使用特征部件统领基本编码部件时,个别部件的键盘配置可不严格按照其包含的特征部件定位,而是按需调整,如“足”由“O”位调整到“Z”位;6.基于特征部件编码的部件副码的长度及其键盘配置可作调整。
7.以上6项调整在数字键盘布局中同样适用;以上7项的调整后形成的本发明的多个实施例皆属于本发明创造保护范围内的同等技术置换,只要是以本发明核心部件编码技术为基础的调整变动皆不能离开本发明的授权而单独申请发明专利或改进型专利。
本发明在输入实践中的应用可举例如下本发明中的特定部件集合可以是使用“主部件拆分法”得到的基本部件集合,由此形成的部件编码体系不仅合体字拆分简单直观。部件选取符合规范,而且见字得码,形成“无编码的编码”技术。主部件是在造字法中使用频率较高的规范部件。主部件拆分法是一种在规定部件集合拆出少数主部件得到基本编码部件的编码专利技术。
本发明结合识别码组合体系形成的整套输入方案实施例可适应新时代汉字输入的个性化需求。识别码是汉字中除部件以外的其他可用于编码的信息,包括1.汉字的声母;2.汉字的韵母;
3.汉字的声调;4.汉字的结构(上下,左右,包围,独体);5.部件的声母;6.部件的韵母;7.部件的声调;8.相邻部件间的组合关系(上下,左右,包围,相交);9.部件的笔划总数;10.部件的特定位置的笔划如首笔划或末笔划;11.部件的结构即笔划组合方式(单,交,连,散,混)。
12.特定位置处的笔划与其他笔划间的组合关系(单,交,连,散)。
13.部件与英文字母或数字的象形特征,如部件“口”与英文字母“O”或数字“0”象形。
以上13种识别码及其相互间的组合关系构成了识别码组合体系,取码时,根据个性化需求或调整重码的必要性灵活选取其中某项或某几项的组合。
权利要求
1.一种汉字部件编码法及其键盘,其特征在于在某给定部件集合中,可以使用特征部件统率基本编码部件来形成部件的编码体系;精选笔划数较少的,带有典型造字特征的都件,根据谐调性和规律性原则分配其键盘键位,把这些典型部件称为特征部件。
2.如权利要求1所述的部件编码法及其键盘,其特征在于特征部件的设置可如附图1中所示。
3.如权利要求1所述的部件编码法及其键盘,其特征在于给定部件集合可以是多种集合甚至是字符集,如可以是规范部件或独体字和独体字形集。
4.如权利要求2所述的部件编码法及其键盘,其特征在于特征部件的选取可适当添加,减少或调整,如“”可不选用。
5.如权利要求1所述的部件编码法及其键盘,其特征在于特征部件和基本编码部件可以使用“象形编码法”定位;“象形编码法”是象形造字法在编码学的应用,其关键技术在于编码用的部件或字根与英文字母或数字的相似性或会意性,如附图3所示,其中的“象形特征”是用一句话来概括特征部件与字母或数字的象形或会意的特征,如“口”与“0”键的共同特征是“笑口常开”。
6.如权利要求1、2和5所述的部件编码法及其键盘,其特征在于基于特征部件的基本部件编码体系对英文键盘和数字键盘全面兼容。
7.如权利要求1、2和5所述的部件编码法及其键盘,其特征在于特征部件的英文或数字键盘配置可按需调整,如“亻”由“G”位调整到“J”位,相应地由此特征部件统率下的该类基本部件亦随之调整。
8.如权利要求1、2和5所述的部件编码法及其键盘,其特征在于个别基本部件的英文或数字键盘配置可不严格按照其包含的特征部件定位,而是按需单独调整,如“广”字可由“Y”键调整到“I”键。
9.如权利要求1、2和5所述的部件编码法及其键盘,其特征在于还可存在多种方法来安排特征部件的键位,如完全根据手指负荷原理安排键位、根据特征部件的声母与英文字母的对应性安排键位等等。
10.如权利要求1、2和5所述的部件编码法及其键盘,其特征在于还可基于特征部件设置部件副码;部件副码是在部件原有代码基础上额外添加一个或多于一个的代码,从而形成部件的多码体系,部件原有的代码称为部件的主码,额外添加的代码称为部件的副码;本发明中得到部件副码的方法可以是基本部件按“取大优先”原则取出其笔划结构中包含的第一个特征部件作为主码,其包含的第二个特征部件作为副码的第一代码,其包含的第三个特征部件为副码的第二代码,余下以此类推,直至主副码加起来等于最大码长为止;本发明的部件副码设置可以如附图3所示。
11.如权利要求1、5和9所述的部件编码法及其键盘,其特征在于允许对一些部件的副码做出调整,如在对大字符集汉字编码时,当汉字中首部件的代码长度大于2时,可以规定只取该部件的首二码。
12.如权利要求1-11所述的部件编码法及其键盘,其特征在于可以采用电脑或手持设备的英文或数字键盘,在对应的字母或数字键位上,可以标识出特征部件、基本编码部件及部件副码,可以如附图1、2、3、4分别所示其中附图1是本发明在“象形编码法”应用下的一种特征部件英文键盘布局实施例;附图2是本发明在“象形编码法”应用下的一种特征部件数字键盘布局实施例;附图3是本发明应用于本发明人另外发明创造的一种汉字输入法时的部件编码体系的键盘配置图。
13.如权利要求1-12所属的部件编码法及其键盘,其特征在于本发明可以用于形码、形声码、声形码和音码等多种汉字输入法中对汉字的部件进行编码。
全文摘要
一种汉字输入法中部件编码法及其键盘,其特征在于一套由特征部件到统率基本编码部件而形成的无须记忆,见字识码,取码思维与认字部件思维同一的部件编码体系,该部件编码体系同时适用于英文键盘和数字键盘。
文档编号G06F3/023GK1284668SQ9911439
公开日2001年2月21日 申请日期1999年8月15日 优先权日1999年8月15日
发明者白春荣 申请人:白春荣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1