主部件拆分法的制作方法

文档序号:6606010阅读:507来源:国知局
专利名称:主部件拆分法的制作方法
技术领域
本发明属于汉字输入法及其键盘,特别是部件编码法及键盘。
在造字法中,汉字的基本构字要素是部件,也称字根。使用部件或字根进行汉字的编码是目前电脑汉字输入法的主流。但是,如何科学选取编码用的部件或字根一直是困扰当今编码学界的难题。现有技术中绝大多数形码方案都是人为地、主观地选用编码部件,对汉字任意拆分,部件之间无联系、部件的记忆缺乏规律性。因此,这些输入法普遍存在着部件选取严重不规范,与汉语言文字的部件标准严重不符的弊端;并且究竟哪些是编码部件、哪些不是编码部件必须用户强记;同时,对如何从汉字中拆出编码部件各方案都没有统一的标准,有的汉字要求这样拆、有的又要求那样拆,如在五笔字型中,“天”与“夫”同有两个部件“一”和“大”,但是该输入法却要求“天”拆成“一”和“大”,而“夫”拆成“二”和“人”,所以易产生歧义性,用户很难掌握。
综上所述,本发明的目的在于彻底解决汉字输入方案中特别是形码方案中如何科学地、规范化地选取基本编码部件难题,全面实现基本编码部件的无须记忆并且消除汉字拆出部件时的歧义性。
本发明基本特征在于一个编码部件体系由特定的部件集合拆出主部件而得到的部件编码技术及一套符合国标GF3001-1997部件规范和《现代汉语通用字笔顺规范》的易学易用、无歧义性、见字拆分、无需记忆的的编码部件体系。
本发明中的主部件又称主根,是在造字法中使用频率较高的规范部件。主部件的使用解决了形码中部件或字根的选取难题由于现有的形码技术必须强记一定数量的部件并结合复杂的规则来拆分部件,使得输入法难学难记,难用易忘,严重制约了输入法的推广普及。但是,如果设定较少数量的重要部件,从独立部件或一已知界定范围的部件集合内,当某部件的笔划组合中包含有这些重要部件时,就必须以符合语言文字规范的原则拆出这些重要部件,这些重要部件即为主部件,拆出后的部件作为编码部件,而原有的部件不再作为编码部件,其中独立部件是汉字中自然分离的模块,组成汉字的各个独立部件之间有着明显的间隙如“密”字由“宀必山”三个独立部件组成。因此,如果设定了“日”是主部件,则对于“甲、里、电、更”等本身即为独立部件的这些字,就必须拆出其中所嵌含的“日”,同时,这些独立部件不再作为编码部件。本发明的核心技术便在于这种编码部件集合无须用户强记,而在取码过程中随时由独立部件或给定部件集合拆出主部件得到的编码方案。本发明在拆出主部件时,要求符合《现代汉语通用字笔顺规范》,如“夷”应拆成“一、弓、人”而不是“大人”,因此,本发明得到的基本编码部件直观规范,具有良好的整体性,即使可能得到的个别部件在规范部件表中并没有,但这类部件的笔划结构特征与规范部件基本相似,它们的存在不仅为编码学所允许,亦是必须的,这类部件称为形似部件。同时,本发明允许通过调整主部件的选取、修改拆出主部件的方法、直接调整基本部件集合或添加个别合体字作为部件等办法来减少形似部件。如可以规定“疋”字不拆出“人”。
本发明中主部件的数量以不超过基本编码部件总数的25%为优,也可根据需要怍适当调整,调整幅度可为50%左右。如本发明中主部件的设置可以是“金(钅)木水(氵)火(灬)土,人口(口)虫鱼(魚)鸟(鳥),日(日)月(冃)山石大(尢),未巾王()夫小( )”。亦可根据符合规范、降低重码、适于操作的需要做相应变动,如“未夫”可不选用,而添加“又西”等等。
当在BIG5或GB13000.1字符集中使用本发明时,由繁体部件拆出主部件后会得到的一些繁体编码部件,如以上所示的主部件“鱼”。繁体编码部件的设置亦可根据字符集的大小按需调整。
本发明中用于拆出主部件的部件集合可以是独立部件集、国家语委颁布的规范部件集,也可以是某输入方案中特定的部件集合,只要是能够有一种简单的方法来界定该部件集合的范围即可使用本发明。
本发明亦允许对拆出主部件后最终得到的基本编码部件集合进行少量调整,如可适当添加或减少个别编码部件或是添加个别合体字如“可早”等字作为基本编码部件。
本发明最终得到的基本编码部件的键盘配置可以有多种方案,如可根据部件的声母定位、根据部件的首二笔划组合定位、根据部件的笔划数定位、或是结合本发明人的另一项专利发明“特征部件编码法”分配键位。特征部件是一些笔划数较少的,带有典型造字特征的部件,可根据谐调性和规律性原则分配其键盘键位;“特征部件编码法”是当某基本编码部件前几个笔划构成的字形结构特征与一特征部件相同时,该编码部件的键位即此特征部件的键位,如编码部件“丰”的特征部件为“三”,“丰”和“三”的代码都为“E”或“3”,由此,部件的编码任务集中为少数几个特征部件的编码,最终使整个部件体系的部件编码无须记忆、易学易用。
本发明基于对汉字文化最高层次的感悟和对汉字造字法全面深刻的理解,广泛系统地分析研究了汉字固有的信息熵,最终提出的编码部件选取解决方案彻底征服了输入法特别是形码输入法中多项举世公认的难题,实现了以下多项编码部件技术的革新1.使形码中部件的选取科学化,且无须用户记忆具体的编码部件汉字输入法发展到今天,大致可分为形码、音码、音形码和流水码4种,各有其优缺点,谁也不能代替谁。其中,形码以其重码率低、速度快相对应用较多,但是形码的部件及其编码的记忆严重制约着形码的普及,特别是形码中编码部件的选取最令人头疼。形码的部件不可太少,否则使取码信息少,码长短,重码率高;部件又不可太多,否则影响汉字结构的整体性,规范性。已有的技术多是选取较多数量的部件,辅以复杂的取码规则,普通人需很长时间方能记住的部件,如不经常使用便很快忘得一干二净。以“五笔字型”为例,其选用的200多个部件,规律性差,每个部件都需记忆,普通人需数周时间才能背熟。本发明的基本编码部件从独立部件集或已知界定范围的部件集合拆出主部件自然得到,无需记忆各个具体的部件,在知道界定部件的范围后,剩下的只是主部件的熟悉了。而编成顺口溜的几个主部件比拼音还好记,一般人看一遍便可掌握。同时,优选的主部件都是造字法中使用频率较高的部件,如“金木水火土”等字,拆出这些部件,不仅有效减少了用于编码的基本部件,使得汉字的取码信息得到保证,利于重码率的降低;也保证了使用频率较高的部件不被无理拆分,提高了输入的速度。
2.实现了部件拆分的无歧义性给出了编码部件后,如何从汉字中拆出这些部件是形码编码的又一项难题。因取码规则要求简单、无歧义性,而现有的方案几乎无一例外地额外添加了许多艰涩难懂、复杂而又牵强附会的拆分规则,甚至需要强行记忆大量汉字的具体拆分方法,使得形码编码在难记的基础上还更加难学。同样以“五笔字型”为例,其“兼顾直观”的规则一般人很难掌握,不同人对汉字有不同视点,究竟什么才是“直观”,易产生歧义性。本发明的基本编码部件从独立部件集或已知界定范围的部件集合中拆出主部件自然得到,无任何拆分规则,只需符合汉语言文字规范即可,因此避免了拆分汉字的歧义性,使输入法易学易用,便于普及。
3.全面实现了部件的规范化以往的形码对汉字任意拆分,选用的部件与语言文字规范严重不符,影响了中小学的文字教育,特别是在国家语委颁布了《部件规范》后,编码部件的规范化已成为形码的基本要求。本发明使用“主部件拆分法”得到编码部件,因主部件的选取科学、严谨、数量较少、并且带有明显的造字特征,能够与其它的部件结合成新的部件,所以本发明最终得到的基本部件全部属于语委规范部件,即使存在个别形似部件,也与规范部件字形结构相似,不会影响到语言文字教育,并且,这个别的形似部件也可以通过调整基本部件集的方法来消除,本发明彻底解除了汉字输入法特别是形码输入法中基本编码部件的记忆烦恼,可广泛应用于各种形码输入方案中。在已知范围的某部件集合或独立部件集合中选取较少数量的主部件,使用本发明按符合语言文字规范的原则对原部件集合拆出主部件,便可达到基本编码部件或字根的无须记忆、见字拆分而无歧义的效果。使用本发明,从此形码再也不须记忆,易学好用,便于普及。本发明还可应用于音码方案中,将使用本发明得到的基本编码部件按简单易行的原则分配键位代码,置于汉字音码的前面或后面,即可在不增加记忆负担的基础上大大降低音码的重码率,提高输入速度。
本发明突出的实质性特点在于科学地选取汉字部件中固有的信息熵-主部件,按符合汉语言文字规范的原则从独立部件集或已知界定范围的部件集合中拆出主部件,最终形成的无须记忆、见字拆分且无歧义的基本编码部件体系。本发明将用户从编码部件的记忆重压下解放出来,为汉字输入法特别是形码的真正普及铺平了道路。从此,汉字输入迈进了一个全新的时代,汉字文化必将更加发扬光大。
本发明显著的进步性在于,在已知界定范围的部件集合后,使用拆分主部件得到基本编码部件这样一种形码部件的选取方案,不仅在保证部件良好的整体性、直观性基础上使基本编码部件数量适中,取码信息能够满足形码要求;而且在不额外添加任何规则的情况下避免了取码拆分的歧义性,降低了编码的学习难度;更重要的是,究竟哪些是编码部件、哪些不是,无须用户事先掌握,而是在取码过程中自然地拆出主部件得到,从根本上克服了以往形码需要记忆的弊端。本发明实现了基本编码部件的见字拆分,为形码用户解开了繁重的部件记忆枷锁,而且最终得到的部件体系完全符合编码学的规范化要求,取码拆分简单方便、直观自然。本发明彻底解决了形码编码时的编码部件选用难题,具有高度的创造性和突出的实用价值。
本发明结合“特征部件编码法”专利技术形成的本发明的应用实施例,可实现形码编码部件体系和部件编码体系的无须记忆、见字得码,使得中国人几十年来梦寐以求的“无编码的编码”技术成为可能。
本发明可结合部件副码形成本发明的输入法方案应用实施例,从而解决一些由2-3个部件组成的汉字引起的重码问题。部件副码技术是本发明人首创的一项部件编码技术,又称部件副码编码法。其要点是在部件原有的单个代码基础上额外添加一个或多于一个的代码,从而形成部件的多码体系。部件原有的代码称为部件的主码,额外添加的代码称为部件的副码。部件副码的使用既保证了部件不会被无理拆分,保证了部件的整体性和规范化,同时又在不增加取码思维难度和记忆难度的基础上加大了码长,使重码率降低在允许的范围内。
本发明结合识别码组合体系形成的整套输入方案实施例可适应新时代下输入的个性化需求。识别码是汉字中除部件以外的其他可用于编码的信息,包括1.汉字的声母;2.汉字的韵母;3.汉字的声调;4.汉字的结构(上下,左右,包围,独体);5.部件的声母;6.部件的韵母;7.部件的声调;8.相邻部件间的组合关系(上下,左右,包围,相交);9.部件的笔划总数;10.部件的特定位置的笔划如首笔划或末笔划;11.部件的结构即笔划组合方式(单,交,连,散,混)。
12.特定位置处的笔划与其他笔划间的组合关系(单,交,连,散)。
13.部件与英文字母或数字的象形特征,如部件“口”与英文字母“O”或数字“0”象形。
以上13种识别码及其相互间的组合关系构成了识别码组合体系,取码时,根据个性化需求或调整重码的必要性灵活选取其中某项或某几项的组合。
本发明的核心技术在于一套已知界定范围的部件集合拆出主部件得到基本编码部件的符合规范的编码部件体系以及本发明在各种输入方案下的灵活应用的实施例。为适应输入法个性化需求,符合科学性及规范化原则,本发明可通过以下诸项的调整来实现本发明的多个实施例1.界定的部件集合可以是多个来源,如可以是规范部件、可以是独立部件、可以是独体字或独体字形等;2.主部件的个数以不多于基本编码部件的25%为优,同时允许一定范围的变动,但无论变动幅度多大,只要是采取了从规定部件集合内拆出主部件得到编码用部件的这种技术方案,就不能离开本发明的授权而单独实施其该进型专利;3.主部件的选取可作调整,如“夫”可不选用。“西”选用;4.给定部件集合拆出主部件的方法原则上应符合汉语言文字规范及笔顺规范,但也可作适当调整,如单笔划必须拆出,“吏”可拆成“丈口”等;5.基本部件可根据需要适当添加,减少或调整少量形似部件,如可规定“疋”字不拆出“人”字;6.在G B K或B I G 5字符集中,一些重要的繁体部件可设置成主部件,如“魚糸鳥”三字,且最终形成的基本编码部件中可以包含有繁体部件,如“門”字等,这些繁体编码部件亦可根据需要相应调整。
7.可适当添加个别合体字作为基本部件,如“可早”等字;8.采用本发明核心技术得到编码部件体系后,其另一重要特征便在于本发明的部件编码可以可使用强记、以部件的声母归类、以部件首两个笔划组合归类或以部件前几个笔划构成的字形结构特征归类等多种方法。
以上8项的调整后形成的本发明的多个实施例皆属于本发明创造保护范围内的同等技术置换,只要是建立在采用本发明核心技术来得到编码部件体系的基础上的调整变动皆不能离开本发明的授权而单独申请发明专利或改进型专利。
权利要求
1.一种汉字编码部件选取法及其键盘,其特征在于基本编码部件可由一已知界定范围内的部件集合按汉语言文字规范拆出主部件自然得到,无须记忆具体的那些部件,其中主部件是在造字法中使用频率较高的规范部件。
2.如权利要求1所述的编码部件选取法及其键盘,其特征在于已知界定部件集合可以是独立部件、规范部件或独体字和独体字形。
3.如权利要求1所述的编码部件选取法及其键盘,其特征在于主部件的个数以不多于基本编码部件的25%为优,同时允许一定范围的变动,但无论变动幅度多大,只要是采取了从已知界定范围部件集合内拆出主部件得到编码用部件的这种技术方案,就不能离开本发明的授权而单独实施其该进型专利。
4.如权利要求1所述的编码部件选取法及其键盘,其特征在于主部件的设置可以是“金(钅)木水(氵)火(灬)土,人口(口)虫鱼鸟,日月(月)山石大(尢),未巾夫王()小
5.如权利要求1、4所述的编码部件选取法及其键盘,其特征在于主部件的选取可作调整,如“未夫”可不选用,“西又”选用。
6.如权利要求1所述的编码部件选取法及其键盘,其特征在于给定部件集合拆出主部件的方法原则上应符合汉语言文字规范及汉字笔顺规范,但也可作适当调整,如单笔划必须拆出,“吏”可拆成“丈口”等;
7.如权利要求l所述的编码部件选取法及其键盘,其特征在于由已知界定范围的部件集合拆出主部件后的基本编码部件集中可以包含个别形似部件;形似部件是笔划结构特征与规范部件基本相似的部件,它们的存在不仅为编码学所允许,亦是必须的。
8.如权利要求1、7所述的编码部件选取法及其键盘,其特征在于基本编码部件可根据需要适当添加,减少或调整少量形似部件,可通过调整主部件的选取、修改拆出主部件的方法、直接调整基本部件集合或添加个别合体字作为部件等办法来减少形似部件,如,可以规定“疋”字不拆出“人”。
9.如权利要求1所述的编码部件选取法及其键盘,其特征在于在G B K或B I G 5字符集中,一些重要的繁体部件可设置成主部件,如“魚糸鳥”三字,且最终形成的基本编码部件中可以包含有繁体部件,如“門”字等,这些繁体编码部件设置及其键盘配置亦可根据需要相应调整。
10.如权利要求1所述的编码部件选取法及其键盘,其特征在于可适当添加个别合体字作为基本编码部件。如“可早”等字;
11.如权利要求1-10所述的编码部件选取法及其键盘,其特征在于采用本发明核心技术得到编码部件体系后。基本编码部件的编码可以可使用强记、以部件的声母归类、以部件首两个笔划组合归类或以部件前几个笔划构成的字形结构特征归类等多种方法。
12.如权利要求1-11所述的编码部件选取法纪其键盘,其特征在于本发明可用于形码、音码、形声码和声形码中科学而又规范地选取编码部件。
全文摘要
一种汉字输入法中编码部件选取方法及其键盘,其特征在于:基本编码部件体系由特定的部件集合拆出主部件而得到,且符合国标GF3001—1997部件规范及《现代汉语通用字笔顺规范》,易学易用,拆分无歧义性,无需记忆。
文档编号G06F3/023GK1284669SQ9911439
公开日2001年2月21日 申请日期1999年8月15日 优先权日1999年8月15日
发明者白春荣 申请人:白春荣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1