一种汉字输入法及其键盘的制作方法

文档序号:6416809阅读:194来源:国知局
专利名称:一种汉字输入法及其键盘的制作方法
技术领域
本发明属于汉字输入法及其键盘。
在造字法中,汉字的基本构字要素是部件,也称字根。使用部件或宇根进行汉字的编码是目前电脑汉字输入法的主流。但是,如何科学地选取编码用的部件或字根一直是困扰当今编码学界的难题。现有技术中绝大多数形码方案都是人为地、主观地选用编码部件,对汉字任意拆分,部件之间无联系、部件的记忆缺乏规律性。因此,这些输入法普遍存在着部件选取严重不规范,与汉语言文字的部件标准严重不符的弊端;并且究竟哪些是编码部件、哪些不是编码部件必须用户强记;同时,对如何从汉字中拆出编码部件各方案都没有统一的标准,有的汉字要求这样拆、有的又要求那样拆,如在五笔字型中,“天”与“夫”同有两个部件“一”和“大”,但是该输入法却要求“天”拆成“一”和“大”,而“夫”拆成“二”和“人”,所以易产生歧义性,用户很难掌握。选取部件后必须对部件进行编码,部件或字根的编码需大量记忆是现有技术普遍存在的又一缺陷,大多数编码方案都选用了数百个编码部件,并且有的技术还要求对部件取超过一个的编码,这些部件的编码记忆不仅缺乏规律性,而且取码思维与人认知部件的思维严重不符,从而导致输入法难学难用,严重制约了输入法的普及。另一方面,在个人电脑仍然大量使用于各个领域的情况下,手持电脑及通讯设备也得到越来越广泛的应用,这些设备中的汉字输入往往需要使用数字键盘,信息技术的发展迫切需要一个同时适用于英文键盘和数字键盘的编码方案,而当前国内外的汉字输入法虽多,但能够真正实现英文键盘和数字键盘布局全面兼容的却一个也没有。现有编码技术的缺陷还在于不能同时处理GB2312,BIG5及GB13000.1三个字符集的全部汉字有的技术根本就不能处理除GB2312以外的汉字字符集;有的虽能处理,但是重码率惊人,对20902个汉字编码重码率低于20%且最大码长不大于4的输入法到目前为止尚未出现。现有编码技术还普遍存在一个严重的问题,就是不能很好地适应用户的个性化输入要求不同领域的用户对输入法有其个性化的要求,专业性的文字录入人员要求输入速度快、效率高、符合人体工程学原理、长期使用不致对手指手臂造成损害;普通用户要求简单方便、易学好用、不会遗忘;作家、记者要求直观自然、不影响写作思维;中小学教育要求部件整一、规范、与汉语言文字教育接轨。而当前各种输入法虽各有其一定的应用,但都各有其缺点,形码输入速度快却规则复杂、记忆量大、难学易忘;音码学习快却重码多、速度慢;音形码略有改进但同时继承了音、形码的缺点且取码思维强度大;流水码如电报码之类必须单独记忆每个字的编码故仅限于少数专业领域使用,所以没有一个方案能够同时满足上述个性化要求,仅局限于某一狭窄的领域,一旦用户的需求超出该领域便不再适用,使得一些用户不得不学习多种输入法。
综上所述,本发明的目的在于;彻底解决汉字输入方案中特别是形码方案中如何科学地、规范化地选取基本编码部件的难题,全面实现基本编码部件的无须记忆并且消除汉字拆出部件时的歧义性;彻底克服汉字输入方案中部件的编码需大量记忆的缺陷,并使取码思维与人脑认知部件的思维保持一致;实现同一套部件编码体系对英文键盘和数字键盘的全面兼容,使需要同时使用英文键盘和数字键盘输入汉字的用户无须学习两种不同的输入法;实现编码用的部件体系和部件编码体系能够同时处理GB2312,BIG5及(B13000.1三个字符集的全部汉字;基于核心的部件体系和部件编码体系结合一系列独创的技术发明最终形成的能够适应不同层次,不同领域用户对输入法的个性化需求的一整套技术解决方案;统一汉字输入法,真正结束“万码奔腾”现象。
本发明基本内容包括一个符合国标GF3100-1997部件规范和《现代汉语通用字笔顺规范》的无须记忆、自然拆分的部件体系及无须记忆、见字得码的英文键盘和数字键盘布局全面兼容的编码体系;一个独创的英文和数字键盘配置全面兼容的副码编码体系;一个独创的识别码组合体系及其键盘配置;一套适应输入法个性化需求的全面的技术解决方案。本发明选用的部件包括独立部件,主部件,基本部件,特征部件,形似部件,繁体部件,以上部件配置可以如附

图1、2、3、4、5、6所示。
本发明编码流程①将汉字拆分成独立部件;②根据“主部件拆分法”将独立部件拆出主部件得到基本部件,③根据“特征部件编码法”得到基本部件的主码;④根据不同实施例下的规定码长,当不足最大码长时,结合部件副码或识别码或识别码组合进行编码;⑤根据不同用户的个性化需求,使用“自动创建汉字输入法功能键盘”装置即时生成本发明不同实施例下的多个取码方案。
本发明以规范化原则选取部件,包括1.独立部件又称一般根或独立字根。由造字法知,汉语中90%汉字为合体字,所以部件编码即为合体字的拆分。作为构字的基本要素,规范部件犹如“积木块”一样组合成合体字,绝大多数汉字都能很直观地得到这些“积木块”,如“饿”由“饣”和“我”组成,但也有一些汉字对普通用户来说,不能立即判断由哪些“积木块”组成,所以本发明引入“独立部件”概念,并给出如下定义(1)国标GF3001-1997部件规范中所有部件皆为独立部件;(2)由一个或一个以上基本笔划紧密交连而成,形成不可分割的整体称之为独体字或独体字形,如“钅”“我”等,独体字或独体字形皆作为独体部件。
(3)除单独离散的“一”“乙”“乚”三种特征的单笔划外,其余任何形式的单笔划皆不可作为独立部件,但可与其它独体字或独体字形结合形成独立部件,如“太”“氕”等。
(4)一些独立部件被 夹后。可以形成新的独立部件。
使用上述定义。不仅合体字的拆分简单直观,而且符合规范。独立部件定义可以根据编码需要作适当调整,如作为本发明的一个实施例,在单独处理GB2312字符集时,可不包括规范部件表中的合部件,如“麻”“鼻”等。
2.主部件又称主根,是在造字法中使用频率较高的规范部件。选用部件编码时,直接使用独立部件会使码长较短,重码事高,现有的技术多采用强记一定数量的部件和添加复杂规则来解决这个问题,却又带来了输入法难学难记,难用易忘的矛盾。为此,本发明首创“主部件拆分法”(已申报中国专利技术)选取编码部件设定较少数量的重要部件,对每个独立部件,当某独立部件的笔划组合中包含有这些重要部件时,就必须以符合语言文字规范的原则拆出这些重要部件,拆出后的部件作为编码部件,而原有的部件不再作为编码部件,这些重要部件即为主部件。如设定了“日”是主部件,则对“甲、里、电、更”等自身为独立部件的汉字。就必须拆出这些字中所嵌含的“日”,同时,这些独立部件不再作为编码部件。本发明在拆出主部件时,要求符合《现代汉语通用字笔顺规范》,如“夷”应拆成“一、弓、人”而不是“大人”,因此,本发明得到的基本编码部件直观规范,具有良好的整体性。
本发明中主部件的数量以不超过基本编码部件总数的25%为优,也可根据需要作适当调整,调整幅度可为50%左右。如本发明中主部件的设置可以是“金(钅)木水(氵)火(灬)土,人口(口)虫鱼(魚)乌(鳥),日(日)月(冃)山石大(尢),未巾夫王()小( )”,亦可根据符合规范、降低重码、适于操作的需要做相应变动,如“未夫”可不选用,而添加“又西”等等。
3.基本部件又称基根,是输入法中用于编码的部件。本发明中的基本部件可使用“主部件拆分法”由独立部件拆出主部件得到,无须强记;同时,本发明中基本部件的键盘配置亦无须记忆,而是通过本发明人的另一项已申报中国专利技术的发明“特征部件编码法”得到。精选笔划数较少的,带有典型造字特征的部件,根据谐调性和规律性原则分配其键盘键位,当某基本部件前几个笔划构成的字形特征与一典型部件相同时,该基本部件的键位即为此典型部件的键位,如“丰(三)”等。这些典型部件即为特征部件,由特征部件统率基本部件形成部件编码体系的方法称为“特征部件编码法”。使用“主部件拆分法”和特征部件编码法”是本发明人的创举。由此得到的编码体系不仅简单直观,易学好记,而且符合规范化要求。即使可能得到的个别部件在规范部件表中并没有,如附图2中所示,但这类部件的笔划结构特征与规范部件基本相似,它们的存在不仅为编码学所允许,亦是必须的,这类部件称为形似部件。同时。本发明允许通过调整主部件的选取,修改独立部件拆出主部件的方法,或直接调整基本部件集合,或添加个别合体字作为部件等办法来减少形似部件。如,可以规定“疋”字不拆出“人”等。
4.特征部件,又叫字元或字根头。作为“特征部件编码法”技术的核心,特征部件的选取和键盘配置较为关键。特征部件必须具有较强的代表性,能够统领较多的基本部件,特征部件的定位应最大程度上符合易记性和谐调性原则。本发明中特征部件的选取可如附图1所示,同时可根据符合规范、适合操作、减少重码等要求,做相应调整。本发明中特征部件的定位可采用“象形编码法”定位。“象形编码法”是象形造字法在编码学的应用,其关键技术在于编码用的部件或字根与英文字母或数字的相似性或会意性。同时,象形定位也充分考虑到手指的谐调性原理,让使用较多的部件分配在操作较易的键位。本发明的象形编码法应用可以如附图1所示,其中的“象形特征”是用一句话来概括特征部件与字母或数字的象形或会意的特征,如“口”与O键的共同特征是“笑口常开”。本发明设置的特征部件皆为规范部件,其中五种基本笔划以其声母归类在字母键位上。每个特征部件具体地应按排在那个键位上,应以与字母或数字最大程度地象形或会意而不致牵强附会为准则,当然,本发明亦允许根据需要对一些特征部件的象形归类作变动,如可将“G”位的“厂”调整到“J”位。
本发明也可完全根据手指负荷原理按排特征部件的键位。同时,在使用“特征部件编码法”得到基本部件键位的基础上,也允许个别部件不严格按照其所包含的特征部件定位,而是根据需要硬性规定其英文或数字键盘键位。
5.繁体部件在BIG5或GB3000.1字符集中,由繁体独立部件拆分后得到的一些繁体基本部件,如附图2所示,本发明中繁体部件的设置亦可根据字符集的大小按需调整。
部件副码体系是本发明的又一独创,又称部件副码编码法。其要点是在部件原有的单个代码基础上额外添加一个或多于一个的代码,从而形成部件的多码体系。部件原有的代码称为部件的主码,额外添加的代码称为部件的副码。部件副码的使用既保证了部件不会被无理拆分,保证了部件的整体性和规范化,同时又在不增加取码思维难度和记忆难度的基础上加大了码长,使重码率降低在允许的范围内。但是,副码的数量必须小于最大码长,副码的键盘配置必须易学好记。根据这两个要求,本发明中得到部件副码的方法可以是在小于最大码长的基础上,基本编码部件按“取大优先”原则取出其笔划结构中包含的第一个特征部件作为主码,其包含的第二个特征部件作为副码的第一代码,其包含的第三个特征部件为副码的第二代码,余下以此类推,直至取完为止,如部件“文”的主码为y、副码为x。由此得到的副码体系见字得码,无需记忆。当然,本发明也允许对一些部件的副码做出调整,如限制副码长度、灵活安排副码的取法、硬性规定部件的副码等。需要注意的是,使用特征部件得到部件副码并不是对部件进行二次拆分,而只是形成部件的多码体系的一种技术方案。这种方案对一个部件分配多于一个的编码,部件仍是原来的部件,与使用多个字母来表示一英文词汇是同样道理。
识别码组合体系是本发明为解决输入法个性化需求首创的技术方案。识别码是汉字中除部件以外的其他可用于编码的信息,包括1.汉字的声母;2.汉字的韵母;3.汉字的声调;4.汉字的结构(上下,左右,包围,独体);5.部件的声母;6.部件的韵母;7.部件的声调;8.相邻部件间的组合关系(上下,左右,包围,相交);9.部件的笔划总数;10.汉字或部件的特定位置的笔划如首笔划或末笔划;11.部件的结构即笔划组合方式(单,交,连,散,混),其中混是指组合中有交有连或散。
12.特定位置的笔划与其他笔划间的组合关系(单,交,连,散)。
13.部件与英文字母或数字的象形特征,如部件“口”与英文字母“O”或数字“0”象形。
以上13种识别码及其相互间的组合关系构成了识别码组合体系,取码时,根据个性化需求或调整重码的必要性灵活选取其中某项或某几项的组合,如可选取汉字的末笔划*汉字的结构构成的识别码组合添加在部件取码不足4码的汉字后达到降低重码率的效果,但是,无论如何选取,只要是以本发明部件体系为核心,皆属于本发明的实施例。各识别码的键盘设置可分别如附图7、8所示,亦可根据需要作相关调整。
本发明的一个重要特色在于,本发明取码规则以前述取码流程为基础,在不同实施例下可以有多种方法,举例如下1.在英文键盘布局实施例中,最大码长可为4;数字键盘布局中BIG5、GB130001可为6,在GB2312中可为5;2.当汉字拆不足4个部件时,可加末部件副码结合识别码或识别码组合取码;3.当汉字拆不足4个部件时,可结合识别码或识别码组合取码;4.数字键盘布局中,可在首部件后加一个部件副码或识别码或识别码组合来增大码长,降低重码;5.可以直接取汉字首末部件码再加上该汉字声母取码,形成字取3码词取4码的编码模式;6.可以直接取汉字声韵双拼码再加上该汉字首部件码或首末部件码形成声形码模式;7.当结合识别码或识别组合取码时,可适当使用“识别码离散编码技术”。这种技术的核心是对产生重码的汉字对,有选择地对其中的较不常用的或属于繁体的汉字添加识别码,而另一些汉字不加识别码。这样,可将由于相同识别码引起的重码汉字有效的离散开来,还起到了减少码长、降低取码思维难度、提高输入速度的效果。
适应输入个性化需求是本发明的一项基本目标,本发明不同实施例下的各种取码方案皆是本发明不可或缺的组成部分。但是,给出这些方案的所有码表是极不现实的,必须有一种自动化装置能够根据需要瞬时生成这些方案的技术实现,这个装置便是本发明人的又一项发明“自动创建汉字输入法功能键盘”。该装置主要包括通用的英文或数字键盘;控制基本编码部件集和选择识别码组合的编码信息控制部;控制取码规则的取码规则控制部;控制键盘布局的键盘功能部。其中,通用的英文或数字键盘是本发明的外在硬件形体,与本发明中其它控件形成有机的硬件整体,从而实现汉字的输入功能。“编码信息控制部”的基础是一个汉字编码信息库,它包括每个汉字的基本部件组成列表、每个汉字的笔划组成列表、每个部件的笔划组成列表和13项可用于编码的辅助信息列表如汉字的音等。这些列表构成一个自动化的检索体系,根据用户对基本部件集的调整或辅助编码信息的选取,“键盘功能部”自动给出以上编码信息的键盘配置(用户可作修改),并同时在“取码规则控制部”给出适应选定编码信息的取码规则,最终自动生成本发明的适应用户个性化要求的英文或数字键盘实施例。该装置集成了汉字形,音,义所有可用于编码的信息,与英文键盘及数字键盘形成有机的硬件整体,几乎任何人都可以根据其个性化要求,即时得到本发明不同实施例下的任何一个键盘布局。
本发明可以采用电脑或电子设各的英文或数字键盘,在对应的字母或数字键位上,可以标识出主部件,基本部件,特征部件,部件副码,识别码组合体系及高频字,可如附图1,2,3,4,5,6、7、8分别所示。附图1是本发明的一种基本部件方案,其中基本部件后小括号内为该基本部件的副码;附图2是本发明对附图1部件方案略作调整后的一种实施例;附图3是本发明基于附图1部件方案所示实施例下的英文键盘键位图;附图4是本发明基于附图1部件方案所示实施例下的数字键盘键位图;附图5是本发明基于特征部件的一种简明英文键盘键位图;附图6是本发明基于特征部件的一种简明数字键盘键位图;附图7是本发明的各识别码的英文键盘配置的一种实施例;附图8是本发明的各识别码的数字键盘配置的一种实施例;本发明基于发扬汉语言文字优势,促进中国信息技术的普及和发展,统一汉字输入法,实现汉字输入的国际化这一根本如发点,呕心沥血,刻苦攻关,终于全面解决了汉字输入领域多项举世公认的技术难题。与其他输入法相比较,本发明的创新性和实用性集中体现在以下攻关课题的技术解决方案中一.编码易学易用,应用广泛,便于普及汉字输入码发展至今天,可分为1.形码特点是输入速度快,但规则复杂,记忆量大,难学易忘;2.音码学习快,却重码多,输入速度慢;3.音形码兼有前二者的优点,亦继承了前二者的缺点;4.流水码如电报码之类,仅限于少数专业领域使用。四类码各有其优缺点,谁也不能代替谁,形成了万“码”奔腾的局面。一个真正优秀的良“码”必须是(1)重码率低,取码思维单一,输入速度快,四类码中只有形码或流水码能达此要求;(2)取码规则简单,无需记忆,见字得码,音码或音形码虽然简单却不符合要求(1),流水码记忆量太大根本无法普及。
基于以上分析,本发明定位为①一个选取规范部件为核心的形码方案;②一个无需记忆的实现“无编码的编码”的部件体系。
形码编码技术的关键又在于1.编码部件的选取部件不可太少,否则使取码信息少,码长短,重码率高;部件又不可太多,否则影响汉字结构的整体性,规范性;同时,取码规则必须简单,无歧义性。已有的技术多是选取较多数量的部件,辅以复杂的取码规则,普通人需很长时间方能学会,并且很快便遗忘。以“五笔字型”为例,其选用的200多个部件,规律性差,每个部件都需记忆,普通人需数周时间才能背熟。本发明的基本编码部件从已知独立部件集合拆出主部件自然得到,无需记忆各个具体的部件,在知道界定部件的范围后,剩下的只是主部件的熟悉了。而编成顺口溜的几个主部件比拼音还好记,一般人看一遍便可掌握。同时,优选的主部件都是造字法中使用频率较高的部件,如“金木水火土”等字,拆出这些部件,不仅有效减少了用于编码的基本部件,使得汉字的取码信息得到保证,利于重码率的降低;也保证了使用频率较高的部件不被无理拆分,提高了输入的速度。
2.部件拆分的歧义性给出了编码部件后,如何从汉字中拆出这些部件是形码编码的又一项难题。因取码规则要求简单、无歧义性,而现有的方案几乎无一例外地额外添加了许多艰涩难懂、复杂而又牵强附会的拆分规则,甚至需要强行记忆大量汉字的具体拆分方法,使得形码编码在难记的基础上还更加难学。同样以“五笔字型”为例,其“兼顾直观”的规则一般人很难掌握,不同人对汉字有不同视点,究竟什么才是“直观”,易产生歧义性。本发明的基本编码部件从已知独立部件集合拆出主部件自然得到,无任何取码规则,只需符合汉语言文字规范即可,如独立部件“耂”拆出主部件“土”后得到“土”和“丿”两个基本部件。因此,本发明易学易用,便于普及。
2.部件的键位分配部件及其编码的记忆是制约形码普及的根本原因,在花费大量时间记忆后,如不经常使用,便会忘得一干二净,“形码便是记忆”已成一致公认。而建立在造字法和认知心理学基础上的“特征部件编码法”的发明使得形码从此不再需要记忆。认知的语言是图形语言,例如儿童对周围世界的认识最初总是源于万物在其大脑的图形映像。认知的心理在于首先把握事物的特征,然后逐步认识事物的一般和细节。例如认识一个人,我们首先记住的是他的身体特征,特别是他的脸部特征,接着再结合他的姓名年龄或性格等,便可确认是某某人。汉字是象形文字,其本质便是图形。图形汉字是由一个或数个部件组成的,所以部件本身也是图形。于是,对汉字编码的任务便集中于把握部件这种图形的特征上。而部件图形最典型的特征便在于部件前几个笔划所构成的字形结构特征。人在认知部件时,首先通过这种字形结构特征在人脑中形成部件的大体轮廓(也是图形),然后再结合部件的其他笔划进行确认。因此,科学地选取具有典型字形结构特征的部件作代表,将其他部件按前几笔划构成的字形结构特征与代表部件的相同性归类并分配在同一键位上,形成代表部件统率基本部件的编码体系。这种编码体系基于人的认知心理,使取码思维与认知部件的思维保持一致,大大加快了取码速度。更重要的是,这种编码体系使得编码部件的记忆锐减为少数几个代表部件即特征部件的记忆,记住了特征部件的键位,也就同时记住了整个部件体系的键盘配置。
那么应如何记忆这些特征部件呢 在造字法中,汉字的部件最初绝大多数是事物的象形或会意,借用这个原理到编码学中,根据与英文字母或数字的象形或会意性定位特征部件,特征部件的键位即为与其象形或会意的英文字母或数字的键位。因为特征部件的笔划数较少,所以与字母或数字的象形或会意决不会显得牵强附会,而是很自然地得到。如“口”为O键或0键;“人”为A键或8(八)键。由此特征部件的键位无需强记,甚至不再需要区分特征部件与基本部件,当见到一个部件时,只需分析该部件的前几个笔划所构成的字形结构特征与哪个字母或数字象形或会意,这个字母或数字便是该部件的键位代码,真正实现了见字得码,实现了中国人几十年来梦寐以求的“无编码的编码”输入技术。
二.实现部件的规范化以往的形码因设计方案无科学性,不但选用的部件与《部件规范》严重不符,取码时更是脱离笔顺规范任意拆分,从而不能与汉语言文字规范接轨,影响了中小学的文字教育,特别是在国家语委颁布了《部件规范》后,编码部件的规范化已成为形码的基本要求。本发明由于使用了代表当今编码学界最高成果的两项发明创造一“主部件拆分法”和“特征部件编码法”,使得部件体系选取科学严谨、部件编码严格遵循《现代汉语通用字笔顺规范》,整体方案完全符合新时代下汉字编码的规范化要求,根本解决了汉字编码与语言文字教育两者在部件选取上长期以来背道而驰、各行其是的混乱局面。
本发明中部件编码体系结合识别码组合如“末笔划*结构”形成的实施例2能够达到编码要求,重码率较低,但为满足不喜欢识别码或识别码组合的用户的需要,本发明又创造了“副码编码法”来辅助部件编码。部件副码的使用既保证了部件不会被无理拆分,保证了部件的整体性和规范化,同时又在不增加取码思维难度和记忆难度的基础上加大了码长,使重码率降低在允许的范围内。
三.同时处理GB2312,BIG5及GB13000.1三个字符集的全部汉字同时对大字符集中20902个字符编码必须解决取码信息,最大码长,对应繁简字重码三个难题。已有技术中提出的解决办法不多,而真正理想的更少。以98王码为例取码信息额外添加了“末笔字型识别码”和“构形识别码”两种,不仅增加了学习难度,更大大加重了取码思维负担,严重影响了汉字输入速度;最大码长设定为5,使平均码长上升,汉字输入速度再次下降;使用大小写字母分别对繁简汉字编码就必须频繁切换大小写,而普通用户根本无法区分哪些字是繁体哪些字是简体,并且在数字键盘上无法输入。本发明创造性地使用了“识别码离散编码”技术,在保证最大码长为4的前提下,既不额外添加取码信息,亦无需频繁切换键盘,仅在取完部件主码或副码后出现重码时才添加某种识别码(如汉字的结构)或识别码组合(如结构*末笔划)。“识别码离散编码”技术的特征在于并非每一个不足4码的汉字都需要加识别码,而只是在不足4码的重码汉字对中有选择性的添加。表面看来,似乎这种技术必须记忆哪些加识别码那些不加识别码,从而加重了学习的难度。事实并非如此。首先,本发明在取完部件码后出现重码的几率几经很少,国标字符集中仅600多个汉字需添加识别码,相当于五笔字型中二级简码的数量;其次,是否添加识别码有规律可循绝大多数为繁体字或非常用字,在正常输入任务中,这些字的使用频率还不到0.02%;第三,汉语的语素是词,词的输入码是组成词的汉字的第1码或第1,2码,根本用不到识别码。由于使用“识别码离散编码”技术后,2码3码字增加了3倍,4码字大幅度减少,词库容量剧增,所以,在大容量的词库下,需要输入单字的机会很少,需要输入繁体字或非常用字的机会就更少,而输入需要加识别码的繁体字或非常用字的机会就几乎为零了;最后,先进的软件技术和动态化的即时提示解除了用户的一切记忆烦恼。综上所述,采用“识别码离散编码”技术具有取码思维简单直观,平均码长短,词库容量大,繁简体共存,重码率低,输入速度快等多项优点,彻底解决了GBK中20902个汉字的输入难题,成为世界上第一个优秀的大字符集编码方案。
四.在英文和数字键盘上使用同一套部件体系后PC时代的到来,使手持设备得到广泛应用,为适应其体积小便于携带的特点,必须使用数字键盘输入汉字。另一方面,个人电脑依然大量使用于各个领域,信息技术的这种客观形势要求英文键盘与数字键盘并存。但是,能够使用数字键盘输入汉字的编码本就不多,而既适用于英文键盘又适用于数字键盘的规范化的编码方案更是绝无仅有,许多人不得不学习多个输入法,既浪费了宝贵的时间也带来汉字输入的诸多不便。本发明基于对汉字结构的独特认识和对造字法的深层理解,成功运用了代表当今编码学最高水平的三项编码技术“主部件拆分法”,“特征部件编码法”和“象形编码法”,首次实现了部件体系对英文键盘和数字键盘的全面兼容,形成了由象形会意的数字键位统领象形会意的英文字母键位的严谨的编码体系。例如数字键“3”的会意义为“三分”,即部件的特征是前几个笔划由离散的三个相同笔划组成,如“丰川彡巛氵”等字的数字码皆为3;同时,数字键“3”又统领着英文字母健“M”和“E”,“M”的象形义是“三点”如“氵”,“E”的会意义是“三王分天下”包括除三点外的三分部件,如“王丰川彡巛”等。于是“王川”等字的数字码为3,而字母码为E。不难看出,本发明的这种部件体系从数字编码到字母编码或反之的转换形象直观,简单自然,丝毫不影响取码思维,亦不会增加记忆。并且,在允许最大码长为6的数字键盘实施例下,结合部件副码或识别码即可顺利完成GBK大字符集中20902个汉字的数字编码,这是其他任何一种输入法都无法比拟的。
五.适应个性化要求,实现汉字输入法的统一汉字键盘输入法作为使用电脑必备的工具,不同领域,不同层次的用户对其有着不同的理解和要求专业性的文字录入人员要求输入速度快,效率高,符合人体工程学原理,长期使用不致对手指手臂造成损害;普通用户要求简单方便,易学好用,不会遗忘;作家,记者要求直观自然,不影响写作思维;中小学教育要求整一,规范,与汉语言文字教育接轨。另外,不同的用户亦有自己不同的输入习惯,对输入法存在不同的个性化需求。尽管国内外汉字输入法林林总总,层出不穷,却没有一个能够同时满足上述要求,仅局限于某一狭窄的领域,一旦用户的需求超出该领域,用户便不得不重新学习另一种输入法。输入法的学习一个已是够烦,还得多个才能适应不同场合下的输入任务,使得众多用户苦恼万分。同时,每一个输入法总认为自己是最优秀的,而每一个专家又各有各的意见,所以输入法虽多,但究竟应该学习哪一种,许多初学者一片茫然,“只能在计算机前徘徊”。于是,国外大声喧嚷“汉字落后论”,国内一片感叹“电脑难学矣”。这一切都是汉字的过错 非也,一个真正易学易用的,规范化的,大众化的,能够适应个性化需求的输入方案的出现即可彻底驳斥这种谬论,本发明正是这样的一种输入方案。首先,本发明独创了“识别码组合体系”。以见字得码的部件体系为核心,提供的13种识别码几乎覆盖了汉字可用于编码的所有信息,这13种识别码还可交叉组合成40多个实用的组合识别码,尤如点菜一样,每一个用户可根据其个性化的口味爱好任意选用。例如普通用户可选用汉字的结构作为不足4码时的识别码;专业录入人员可选用结构*末笔划;而写作的人则可选用声韵识别码组合再结合汉字的首末部件码取码。其次,本发明人还发明了“自动创建汉字输入法功能键盘”装置,该装置集成统一了本发明整体键盘方案下所有不同实施例,无论用户选用何种识别码或识别码组合,无论采取哪种实施例下的取码规则,只需在该装置中做出相应设置,即可自动生成用户心目中最理想的本发明的各种实施例。该装置与英文键盘或数字键盘有机结合在一起,实现了键盘的智能化、功能化、人性化,极大地拓宽了键盘的应用功能,开创了键盘应用的新时代。“识别码组合体系”与“自动创建输入法功能键盘”两者相辅相成,实现了真正意义上的汉字输入法的统一,为21世纪的汉字应用开辟了一条金光大道,中华民族的瑰宝-汉字文化,必将更加璀璨辉煌。
本发明以统一汉字输入大业为己任,综合语言文字学,计算机科学,信息科学,认知心理学,人体工程学等多学科的相关理论和基本要求,适应新形势下输入领域的发展潮流,以创造性的编码理论为指导原则,实现了编码输入的多项重大突破。本发明以其无可比拟的创新性,严谨的科学性,真正意义上的规范化和广泛的应用前景,远远领先于国内外其他输入法,其显著的进步性在于
一、划时代的研究成果“主部件拆分法”,实现了基本编码部件的见字拆分,为形码用户解开了繁重的部件记忆枷锁,而且最终得到的部件体系完全符合编码学的规范化要求,取码拆分简单方便、直观自然,彻底解决了形码编码时的编码部件选用难题,具有高度的创造性和突出的实用价值。
二、“特征部件编码法”这一重大发明使用特征部件统率基本编码部件最终形成的部件编码体系,使艰巨繁重的编码任务集中为少数几个特征部件的编码,从此改写了“形码即是记忆”的历史,成为编码学史上第一个无须记忆,见字得码的部件编码体系。
三、特征部件的“象形编码法”应用基于对汉字文化最高层次的感悟和对汉字造字法全面深刻的理解,使得部件的象形特征不再牵强附会,真正实现了部件取码思维与部件认知思维的同一性,文字工作者从再不必担心但那汉字输入影响其文思灵感了。
四、“主部件拆分法”和“特征部件编码法”的完美结合,最终圆了编码学界共同的梦想-“无编码的编码”汉字输入技术;五、独创的部件副码编码技术有效解决了重码问题,同时又保证了编码拆分的规范化,为全面提高汉字输入速度奠定了基础。
六、为适应输入个性化需求,首创的“识别码组合体系”,使任何用户都可得到自己心目中的最理想的本发明的实施例;七、“识别码离散编码”技术降低了平均码长,词库容量剧增,极大地提高了汉字输入速度;八、当今世界独一无二的英文键盘布局和数字键盘布局的无缝兼容技术以无可争辩的实施再次证明了汉字文化的优越性;九、首次实现20902个字符的数字键盘输入,开拓了手持设备汉字输入的广泛应用前景;十、第一个实现编码科学性七项指标皆处于世界领先水平的输入法;
十一、选用部件规范,拆分规范,与中小学语言文字教育全面接轨;十二、“自动创建输入法功能键盘”装置创造性的完成一统汉字输入大业的使命,有力驳斥了“汉字落后论”,彻底结束了万“码”奔腾现象;优秀的编码方案使本发明的技术指标达到较高水平1.部件体系同时适用于英文键盘布局和数字键盘布局;2.编码体系能够同时处理GB2312,BIG5及GB13000.1三个字符集的全部汉字;3.最大码长英文键盘配置可取4,数字键盘配置GB2312可取5,BIG5及GB3000.1可取6;4.静态重码率GB2312字符集中2%,BIG5中低于5%,GB13000.1中约为7%;本发明集成了多项高度创造性的技术发明,易学好用,输入速度快,即使是无任何汉语知识的人也能轻易掌握。以下是本发明在某计算机培训班的测试效果;1.受试对象;干部,工人,学生2.受试人数46人3.测试时间45分钟4.测试效果其中5人在理解本发明的编码流程图后,即可离开讲解员独立上机;25分钟后,33人可使用本发明输入一篇约50字的短文章;45分钟后,本发明的基本部件体系及编码方法掌握率为100%;本发明人声明
本发明的核心在于一套使用“主部件拆分法”得到的基本部件体系及其使用“特征部件编码法”得到的编码体系结合“副码编码法”和“识别码组合体系”取码的同时适用于英文数字键盘的整体方案,以及这一整体方案在各种情况下的不同实施例。为适应输入法个性化需求。符合科学性及规范化原则,本发明可通过以下诸项的调整来实现本发明的多个实施例1.独立部件的定义可稍加修改,如可以仅定义为规范部件或独体字和独体字形;2.主部件的个数以不多于基本编码部件的25%为优,同时允许一定范围的变动,但无论变动幅度多大,只要是采取了从规定部件集合内拆出主部件得到编码用部件的这种技术方案,就不能离开本发明的授权而单独实施其该进型专利;3.主部件的选取可作调整,如“夫”可不选用,“西”选用;4.给定部件集合拆出主部件的方法原则上应符合汉语言文字规范及笔顺规范,但也可作适当调整。如单笔划必须拆出,“吏”可拆成“丈口”等;5.基本部件可根据需要适当添加,减少或调整少量形似部件,如可规定“疋”“皮”等字不拆;6.在G B K或B I G 5字符集中,一些重要的繁体部件可设置成主部件,如“魚糸鳥”三字,且最终形成的基本编码部件中可以包含有繁体部件如“門”字等,这些繁体编码部件亦可根据需要作相应调整。
7.可适当添加个别合体字作为基本部件。如“可早”等字;8.基本部件中的繁体部件的选取及定位可作调整;9.特征部件的选取可适当添加,减少或调整,如“丄”可不选用。
10.特征部件的定位方法可作调整,如既可使用“象形编码法”,也可完全根据谐调性分配键位。
11.使用“象形编码法”对特征部件的定位可作调整,如“八”可设置为“V”键。
12.使用特征部件统领基本编码部件时,个别部件的键盘配置可不严格按照其包含的特征部件定位,而是按需调整,如“足”由“O”位调整到“Z”位;13.基于特征部件编码的部件副码的长度及其键盘配置可作调整。
14.识别码组合体系中13种识别码的键盘配置及识别码组合的键盘配置可作调整;15.以上14项调整在数字键盘布局中同样适用;16.本发明根本出发点在于统一输入法,采用核心的部件体系后,其另一重要特征便是允许存在多种取码规则,如部件副码的使用与否,识别码及识别码组合的选择,不同字符集或不同取码方法下最大码长的规定,英文键盘和数字键盘间转换时取码规则的调整等等以上16项的调整可通过本发明的另一相关发明“自动创建输入法功能键盘”装置瞬时生成,构成了本发明独有的技术特征,调整后的多个实施例皆属于本发明方案保护范围内的同等技术置换,只要是以本发明核心部件体系为基础的调整变动皆不能离开本发明的授权而单独申请发明专利或改进型专利。
权利要求
1.一种汉字输入法及其键盘,其特征在于综合汉语言文字学,计算机科学,信息科学,认知心理学,人体工程学等多学科理论的编码体系中的组字部件全部隶属于国标GF3100-1997及整字,并以符合《现代汉语通用字笔顺规范》及汉语言文字规范的原则进行拆分取码而形成的部件编码体系,本发明的部件可分为独立部件,主部件,基本部件,特征部件,形似音部件,繁体部件,以上部件的键盘配置可以如附图1、2、3、4、5、6别所示。
2.如权利要求1所述的输入法及其键盘,其特征在于基本部件可以使用“主部件拆分法”得到;主部件是在造字法中使用频率较高的规范部件;“主部件拆分法”指在一个已知界定部件(如独立部件)集合内,当某部件的笔划组合中包含有主部件时,就必须以符合语言文字规范的原则拆出主部件,拆出后的部件作为编码部件(即基本部件),而原有的音部件不再作为编码部件。
3.如权利要求1所述的输入法及其键盘,其特征在于基本部件可以使用“特征部件编码法”分配键位;精选笔划数较少的,带有典型造字特征的部件,根据谐调性和规律性原则分配其键盘键位,把这些典型部件称为特征部件;当某基本部件前几个笔划构成的字形特征与一特征部件相同时,该基本部件的键位即为此特征部件的键位,如“丰(三)”等,由特征部件统率基本部件形成部件编码体系的方法称为“特征部件编码法”。
4.如权利要求2所述的输入法及其键盘,其特征在于已知界定部件集合可以是独立部件、规范部件或独体字和独体字形。
5.主部件的个数以不多于基本编码部件的25%为优,同时允许一定范围的变动,但无论变动幅度多大,只要是采取了从规定音部件集合内拆出主部件得到编码用部件的这种技术方案,就不能离开本发明的授权而单独实施其改进型专利;
6.如权利要求2所述的输入法及其键盘,其特征在于主部件的的选用可作变动,如“未夫”可不选用,“又西”选用。
7.如权利要求2所述的输入法及其键盘,其特征在于独立部件拆出主部件的方法原则上应符合汉语言文字规范及笔顺规范,但也可作适当调整,如“吏”字可拆成“丈口”、规定单笔划必须拆出,等等。
8.如权利要求2所述的输入法及其键盘,其特征在于基本部件集中可以包含个别形似部件;形似部件是笔划结构特征与规范部件基本相似的部件,它们的存在不仅为编码学所允许,亦是必须的,如附图2所示。
9.如权利要求2所述的输入法及其键盘,其特征在于基本部件集允许通过调整主部件的选取,修改独立部件拆出主部件的方法,或直接调整基本部件集合等办法来添加,减少或调整形似部件,如可以规定“缶”字不拆出“山”,见附图2。
10.如权利要求2所述的输入法及其键盘,其特征在于允许适当添加个别独立部件或合体字作为基本部件,如附图2中添加了“可”字。
11.如权利要求3所述的输入法及其键盘,其特征在于特征部件。的选取可适当添加,减少或调整,如“”可不选用,见附图2。
12.如权利要求3所述的输入法及其键盘,其特征在于特征部件和基本部件可以使用“象形编码法”定位;“象形编码法”是象形造字法在编码学的应用,其关键技术在于编码用的部件或字根与英文字母或数字的相似性或会意性,如附图1所示,其中的“象形特征”是用一句话来概括特征部件与字母或数字的象形或会意的特征,如“口”与“0”键的共同特征是“笑口常开”。
13.如权利要求12和3所述的输入法及其键盘,其特征在于基本部件编码体系对英文键盘和数字键盘全面兼容。
14.如权利要求12和3所述的输入法及其键盘,其特征在于特征部件的英文或数字键盘配置可按需调整,如“亻”由“G”位调整到“J”位,相应地由此特征部件统率下的该类基本都件亦随之调整。
15.如权利要求12和3所述的输入法及其键盘,其特征在于个别基本部件的英文或数字键盘配置可不严格按照其包含的特征部件定位,而是按需单独调整,如“广”字可由“Y”键调整到“I”键。
16.如权利要求1所述的输入法及其键盘,其特征在于还可以设置繁体部件;繁体部件是在BIG5或GB3000.1字符集中,由繁体独立部件拆分后得到的一些繁体基本部件,其设置可以如附图2所示。
17.如权利要求16所述的输入法及其键盘,其特征在于可根据字符集的大小按需变更调整繁体部件的选取及其英文或数字键盘设置。
18.如权利要求1、2、3、12所述的输入法及其键盘,其特征在于还可设置部件副码;在部件原有代码基础上额外添加一个或多于一个的代码,从而形成部件的多码体系,于是部件原有的代码称为部件的主码,额外添加的代码称为部件的副码;本发明中得到部件副码的方法可以是基本部件按“取大优先”原则取出其笔划结构中包含的第一个特征部件作为主码,其包含的第二个特征部件作为副码的第一代码,其包含的第三个特征部件为副码的第二代码,余下以此类推,直至主副码加起来等于最大码长为止;本发明的部件副码设置可以如附图1所示。
19.如权利要求18所述的输入法及其键盘,其特征在于允许对一些部件的副码做出调整,如在对大字符集汉字编码时,当汉字中首部件的代码长度大于2时,可以规定只取该部件的首二码。
20.如权利要求1所述的输入法及其键盘,其特征在于还可以设置识别码组合体系;识别码是汉字中除部件以外的其他可用于编码的信息,包括(1)汉字的声母;(2)汉字的韵母;(3)汉字的声调;(4)汉字的结构(上下,左右,包围,独体);(5)部件的声母;(6)部件的韵母;(7)部件的声调;(8)相邻部件间的组合关系(上下,左右,包围,相交);(9)部件的笔划总数;(10)汉字或部件的特定位置的笔划如首笔划或末笔划;(11)部件的结构即笔划组合方式(单,交,连,散,混);(12)特定位置的笔划与其他笔划间的组合关系(单,交,连,散);(13)部件与英文字母或数字的象形特征,如部件“口”与英文字母“O”或数字“0”象形;以上13种识别码及其相互间的组合关系构成了识别码组合体系。
21.如权利要求20所述的输入法及其键盘,其特征在于识别码组合体系的英文或数字键盘配置可按需调整。
22.如权利要求1至21所述的输入法及其键盘,其特征在于可以采用电脑或手持设备的英文或数字键盘,在对应的字母或数字键位上,标识出主部件,基本部件,特征部件,部件副码,识别码组合体系及高频字,如附图1至8别所示。
23.如权利要求1至22所述的输入法及其键盘,其特征在于本发明的编码流程可以是①将汉字拆分成独立部件;②根据“主部件拆分法”将独立部件拆出主部件得到基本部件;③根据“特征部件编码法”得到基本部件的主码;④根据不同实施例下的规定码长,当不足最大码长时,结合部件副码或识别码或识别码组合进行编码;⑤根据不同用户的个性化需求,使用“自动创建输入法功能键盘”装置即时生成本发明不同实施例下的多个取码方案;
24.如权利要求1至23所述的输入法及其键盘,其特征在于以前述取码流程为基础,不同实施例下的各种取码方案皆是本发明不可或缺的组成部分,举例如下(1)在英文键盘布局实施例中,最大码长可为4;数字键盘布局中BIG5、GB13000.1最大可为6,在GB2312中可为5;(2)当汉字拆不足4个部件时,可取完末部件副码再结合识别码或识别码组合取码;(3)当汉字拆不足4个部件时,可不使用部件副码而直接结合识别码或识别码组合取码;(4)数字键盘布局中,可在首部件后加一个部件副码或识别码或识别码组合来增大码长,降低重码;(5)可以直接取汉字首末部件码再加上该汉字声母取码或反之,形成字取3码词取4码的编码模式;(6)可以直接取汉字声韵双拼码再加上该汉字首部件码或首末部件码形成声形码模式。
25.如权利要求1至24所述的输入法及其键盘,其特征在于当结合识别码或识别码组合取码时,可适当使用“识别码离散编码技术”;这种技术在重码汉字对中有选择性地添加识别码,有效的离散了重码,还起到了减少码长,降低取码思维难度的效果。
26.如权利要求1至25所述的输入法及其键盘,其特征在于“自动创建汉字输入法功能键盘”装置与英文键盘及数字键盘构成了有机的硬件整体,能够适应个性化需求,自动生成不同取码规则下的21世纪输入法的多种实施例,实现了键盘的功能化、智能化、自动化。
全文摘要
一种汉字输入法及其键盘,其特征在于:基本编码部件的选取科学、规范,拆分无歧义性;部件编码无须记忆,见字识码且取码思维与认知部件的思维同一;能够同时处理GB2312、GB13000.1及BIG5.三个字符集中的全部汉字;对英文键盘和数字键盘全面兼容且能够适应不同层次、不同领域的用户输入的个性化需求。
文档编号G06F3/023GK1284670SQ9911439
公开日2001年2月21日 申请日期1999年8月15日 优先权日1999年8月15日
发明者白春荣 申请人:白春荣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1