教育规范五笔字型汉字输入法及其装置的制作方法

文档序号:6409079阅读:659来源:国知局
专利名称:教育规范五笔字型汉字输入法及其装置的制作方法
技术领域
本发明属于电脑汉字信息处理技术领域,对一项广为使用的五笔字型现有形码汉字电脑输入技术的全方位的创新和突破性技术进步。
国内外现行的“五笔字型”汉字输入技术,包括1985年4月1日申请中国专利,1992年2月26日获得中国专利局授权的85100837.2号发明专利,以及在该技术方案的原则下经发明人王永民稍加调整,从1986年3月开始推广普及的现行“五笔字型”技术。
“五笔字型”已在国内外获得了广泛的应用,成为目前有90%以上电脑用户使用、在国内占主导地位地汉字输入技术。“五笔字型”不仅使高效率输入汉字在报业、出版业、办公自动化等方面成为现实,在联合国、东南亚获得广泛应用,而且,“五笔字型”也正在大规模地走入学校和家庭,几乎成了中国当代青年文明就业的一项必备技术。
科学和技术的发展是一个过程,“五笔字型”也是一项由初级阶段向高级阶段不断发展、不断创新的技术。十年来大规模的应用实践,在验证“五笔字型”现有技术作为一项开拓性发明的科学性、创造性、实用性的同时,随着学术的进步,应用水平的提高以及电脑的普及并进入中小学教育领域,发现了“五笔字型”在规范化、科学性、实用性等方面尚存在着不足甚至严重缺陷,不能满足中小学教育对汉字输入技术学习的强烈要求。这说明,“五笔字型”向规范化、高水平、实用化方向的创新和发展,不但是必要的,也更是极为迫切的。
为克服现行“五笔字型”技术的不足和缺陷,本发明人自1986年起,经过10年潜心研究,广泛听取国内外各界用户的意见,特别是在国家语委多位著名的语言文字学专家、科技界信息处理技术专家、电脑专家的直接指导下,采用理论分析、反复试验和机助设计相结合的手段,终于从五个方面突破了现行“五笔字型”技术方案的框架,确定了该新一代符合教育规范和汉字规范的更高水平、更加实用化的输入技术方案及其装置。
鉴于本发明完成于1995年,本发明的简称为“95版五笔字型及其键盘”或“95版五笔字型”。取“规范”和“五笔”的汉语拼音首字母,即构成本发明的名称缩写字母代码——GWB;
又鉴于十年来社会上已约定俗成地把王永民发明的“五笔字型”编码输入技术叫做“王码”,本发明的另一种简称叫做“95王码”或“规范王码”。
本发明的对比技术即85100837.2号专利所构成的“五笔字型”技术方案,也即当前在国内外广为应用的现行“五笔字型”技术,以下统一简称之为“原方案”。
为了描述之便,以下对本发明简称“95版五笔字型”、“GWB方案”或“GWB”。
根据本发明,描述其输入法及其输入键盘所使用的概念和技术术语定义如下
1、基本笔画本发明所定义的基本笔画有5种,笔画形态及其数字代号为
横(一、
),方向为从左到右,数字代号为1;
竖(丨、亅),方向为从上到下,数字代号为2;
撇(丿),方向为右上到左下,数字代号为3;
点(捺) (丶、_),方向为左上到右下,数字代号为4;
折(乙),带转折的笔画,数字代号为5;
其中折(乙)还包括以下两大类23种
顺时针方向
_


反时针方向_ _
_


2、字型指汉字的拓朴图形分类
左右排列者为左右型,数字代号1
上下排列者为上下型,数字代号2
既不是左右又不是上下排列者,为杂合型,数字代号为3。
为了提取字型信息以离散重码,特别是离散对CJK10646大字符集编码时产生的重码,字型还可进一步细分为4-10种,届时其代号可用0~9代表之。
3、区指按首笔笔画种类划分的字根或部件表上的一个区域或键盘上的一个区域,区号从1到5。
4、位指按部件的次笔特征或末笔特征排列的每一个区中5个键中的某一个键,位号从11到55。
5、部件部件专指被本发明优选作为构字单位的传统部首、笔画结构及其变形或与之“形似”的笔画结构。本发明不采用“字根”这一概念。当依习惯提及“字根”时,在本发明中也专指“部件”。当提及部件拆分的顺序时,为便于称谓,仍沿用“根序”一词。部件中凡成字者为“成字部件”,不成字者为“非字部件”或“不成字部件”。
6、键名指本发明中5区各5位共25个键位上有代表性的第一个部件。
7、主部件、同位部件包括键名在内的有代表性的部件叫主部件,而排列在主部件之后,用括号括起来的该部件的变形或与之同源、形似的笔画结构为同位部件。
8、部件总表本发明中所选中的全部部件,按5区各5位共25位,依主部件在前,同位的部件变形或形似部件在后可用( )括起来,繁体部件可用( )括起来,同时包括双码部件、各单笔画以及由单笔画复合而成的笔形、带“乙”类全部笔画及高频字的表格。
9、键盘图指本发明中将键名、区位码、全部部件或部分部件标示或设计在按键上的设计图或示意图。按照本发明的键盘图制做的键盘,或使用本发明的某系统中配置的键盘都叫做“GWB键盘”。
10、高频字指被安排在本发明25个位(键)上、每位(键)一个的、最常用的25个汉字。一般来说,多数高频字与所在键位(键)上的部件有某种联系。
11、单字编码即字的编码,指按本发明编码法为单字编制的输入码,该输入码有部件分解、区位、字母三种方式。
12、词库也叫词语库、语料库,指由2个以上汉字构成的汉字词语的一个集合。词条的多少不限,在系统中以数据的形式存储在一定的空间中,备查备用。
13、词码指按本发明编码法为两个以上汉字构成的词汇编制的输入码,该输入码有可分别单独使用的部件分解、区位、字母三种方式。
14、二字词指由2个汉字组成的词。
15、三字词指由3个汉字组成的词。
16、四字词指由4个汉字组成的词。
17、多字词指由4个以上汉字组成的词。
18、部件体系指本发明所优选出的部件的总和及其在本发明中相容性、规律性、谐调性按多目标统一的要求分区划位的排列组合。
19、单码部件指一个部件只编一个码的部件。
20、双码部件指一个部件有两个码的部件,双码部件有时也叫“双码字根”。
21、编码部件指依照拆分规则将单字或词语拆分成为部件序列之后,再依照取码规则取出用于编码和输入的部件序列,一般由2-4个部件组成。
22、编码体系指本发明所制订的汉字拆分规则、字词的编码规则以及依此对本发明所适用的汉字集合所建立的部件分解方式、或区位码方式、或字母方式的字词编码码表,或字词编码字典。
23、编码空间指某一码长编码的可能性。四级空间指4码的全部可能性,三级空间指3码的全部可能性,二级空间指2码的全部可能性,一级空间指1码的全部可能性。在本发明中,二级空间即25×25=625,余类推。
24、原码序列指将编码部件对应的区位码(或字母码)从左到右全部列出来后形成的一组代码序列,该序列中如有双码部件,则该双码部件的2个码全部列入。
25、编码流程图指本发明中依编码规则对单字或词语进行拆分编码的操作步骤示意图。
26、识别码即“末笔字型交叉识别码”,指本发明中当一个字拆不够4个部件,因而码长不足4时,必须在其编码之后补加的一个由该字的“末笔代号”与“字型代号”复合而成的一个“交叉识别码”。识别码的多少可由选用的字型多少而定
当采用4种字型时,为5×4=20种,
当采用3种字型时,为5×3=15种,
当采用2种字型时,为5×2=10种,
当采用1种字型时,为5×1=5种。
识别码共有三种可分别单独使用的方式,即部件方式、区位方式、字母方式。
27、码长指依本发明的编码法,为字、词所编出的输入代码的长度,在不计空格键时,该编码长度在本发明中与相应字、词的输入击键次数相等。
28、汉字频度表用于计算键位负荷,其根据是国家语委傅永和先生等编著的《现代汉语通用字表》(语文出版社1989年6月版)“信息交换用汉字编码字符集基本集内汉字数据统计表”所提供的汉字使用频度数据。
29、相容性指若干个部件同处一个键位、享用同一个编码时,相互容纳的程度,可以量化为对重码的影响,即重码数。
30、规律性指部件排列划分键位的规律。可将设计者宣布的若干条规律直接量化到每一个部件上,形成该部件的“规律度”。
31、谐调性指根据人机工程学和工程心理学的原理和试验方法,测算出的键位负荷分布情况。
32、键位负荷指用某种输入法输入汉字时,每一个键位击键次数在总击键次数中所占的百分比值。
33、静态负荷指用某种输入法输入GB-2312.80中全部6763个汉字各一个时,每一键位或某一部件被击次数占总击键次数的百分比值。
34、动态负荷指用某种输入法输入“汉字频度表”所涉及的全部汉字时,每一键位或某一部件击键次数在总的击键次数中所占的百分比值。
35、键位负荷图指将各键位负荷百分比标记在键盘图上而形成的一张便于查阅、分析、对比的图表。
本发明基本上保留沿用“五笔字型”现有技术的如下设计内容
(1)5种笔画横(一)、竖(丨)、撇(丿)、点(丶、_)、折(乙)及其对应的数字代号1、2、3、4、5。
(2)使用有25个输入键的键盘,该键盘既可以是任何一个含有25个字符键位的专用键盘,也可以是一个标准的西文键盘。
(3)将25个键依5种笔画分为5个区,每区5个位。
(4)键名、成字根及最多取“一、二、三、末”四码的字词编码规则。
(5)重码提示、容错码输入的设计方法。
(6)简易型“五笔画”输入法。
以下详细介绍,本发明在突破性地解决原方案的五个方面的不足与缺陷之后而确立的该新的95版五笔字型技术方案,即GWB方案。
首先,介绍原方案存在的以下五个方面的不足
一、原方案“字根体系”缺乏规范,不符合中小学教育中关于汉字字源和汉字构造规律的规范化要求
1、原方案中“自造”了一些不规范的“字根”。
原方案中有“
_、_、
”等“自造字根”。“自造字根”破坏了传统部首笔画结构的整体性。这些“自造”的、专门用于电脑输入的“部件”,虽然在字根归并、减少重码中起到了一定作用,但毕竟与字源、与传统认知习惯和教学规范相去甚远,因而不易于被使用者接受,甚至有些专家因此批评说“五笔字型污染了汉字环境”。
2、字根“止”与“
”,“羊、
”与“_”都是同一字源,但在现有技术中要么同源根分在两处,要么被拆成完全不相同的几个部分。
3、“字根”与“非字根”界限不清,不规范。因字根体系未曾按规范化要求确认,常使学习使用者感到“似象似不象”,在拆分汉字时不敢“下刀”,产生“二义性”甚至“多义性”,严重地影响了汉字拆分的准确性和初学者的学习进度。
如字根“
”在实际拆分中均拆作“七”,但在字根表中并未标明“七”还同时代表“

再如字根口用”实际上还代表了“
、用”,但字根表中未能指示出来。
二、原方案“编码体系”不符合传统习惯和中小学教育中关于汉字教学的规范化要求
1、一批汉字的字根“拆分顺序”不符合正确的书写顺序规范。
如敝丷冂
攵 (按规范应为_冂八攵)
燕廿
口 灬 (按规范应为廿口
灬)
篼_
白儿 (按规范应为_白
儿)
2、一批汉字的字根“拆分结果”不符合汉字的构字规范。
如束一口
(按规范应为木口)
离文凵冂厶 (按规范应为亠乂凵厶)
亍二_ (按规范应为一丁)
象 _
(按规范应为_口
)
3、一批汉字的“拆分笔画顺序”不符合中小学教学中关于笔画顺序的规范要求。
如方 丶一丿
(应为丶一
丿)
成一丿
丶丿(应为一丿
丿丶)
毋 _
一丿 (应为_
丿一)
三、原方案“键盘设计”由于许多“自造”字根的存在,不符合汉字规范
由于键盘上出现了10多个“
_、
_”等“自造”符号,使原方案的键盘设计用作“拼形组字”输入时,不利于中小学生对汉字的正确认知和使用,自然也有碍于在教育系统中普及汉字输入技术。
四、原方案“键盘设计”在人机工程学方面亟需改进,以便使各键位的手指负荷分配更为合理、击键更加谐调
由于历史上发明人对于字根的键位设计只作过定性的研究而未曾定量地同时计算各排键、各手指的静态和动态负荷,因而出现了不匹配、不协调的现象,使得原方案在输入汉字时,上、中、下三排键以及每排键的各个手指的负荷分配不尽合理,使操作者易于疲劳而影响输入效率。
另外,由于字根选取的不合理,未把诸如“母”、“氏”等常用部件作为整部件(即要拆开),也使得原方案在输入相当一些常用汉字,如“每、海、梅、纸、底、低”等时,出现“不顺手”甚至“别手”的现象,从而影响速度,使错码率升高。
五、原方案的严重缺陷必然对汉字规范教学、规范输入产生不良影响
综上所述,现行“五笔字型”在字根选取、编码规则、编码体系以及键盘设计方面存在着比较严重的不足和缺陷。与规范化要求相比,在国家标准6763个汉字中,总共涉及到40%以上的汉字,这其中大部分还是常用字。如果将原方案继续推广下去,而不及时改进、创新,特别是当“五笔字型”大规模地进入学校和家庭之后,必然会产生严重影响
1、不利于中小学里汉字的规范教学,特别是当电脑普及之后,原方案的普及,反过来会影响中小学生对汉字的正确书写。
2、不利于国家语委、国家教委就语言文字规范所颁布的有关文件的贯彻执行。
3、因原方案的字根体系、拆分规则、拆分结果与文字结构传统和汉字教学规范化的要求不相一致,“五笔字型”便不可能大规模地、社会化地进入学校和家庭。
4、不利于进一步提高汉字输入的效率和质量。
5、不利于实现从“用笔书写”向“用电脑书写”这一书写方式的过渡。
6、不利于我国汉字形码输入技术走向统一。
本发明的目的是克服“五笔字型”现有技术以上所列举的全部不足和缺陷,以重新设计的部件集合、部件体系、双码部件及其编码输入法、含双码部件的“根序优先、笔顺规范、尽量取大、兼顾直观”的拆分编码原则及其输入键盘共同形成了一个符合汉字教学规范、更科学、更实用、便于在中小学中推广应用的汉字输入系统,本发明是以“五笔字型”现有技术为基础的一次全方位的发展和创新。
以下结合说明书附图,对本发明的技术方案加以详细介绍,通过以下描述将会从根本上了解本发明的特点、优点和巨大的进步意义


图1GWB部件体系
附图2GWB部件体系与现有技术对比变化一览表
附图3GWB从现行五笔字型字根体系中减少的字根
附图4GWB较现行五笔字型字根体系新增的部件及其所处键位
附图5GWB的“双码部件”及其键位分布
附图6GWB确定的同源、形似、变形部件及其键位分布
附图7GWB繁体部件及其键位分布
附图8GWB基本笔画及其不同形态
附图9GWB编码规则及编码流程图
附图10GWB键盘(用标准英文键盘)
附图11GWB键盘(专用中文键盘)
附图12GWB部件布局“规律度”
附图13原方案字根布局“规律度”
附图14GWB部件静态频度表
附图15GWB部件分类表
附图16GWB主部件开头的部件序列图
附图17GWB检索装置
附图18大、中键盘之内的GWB输入键盘
附图19GWB5×5超小型输入键盘
附图20GWB的信息处理系统
1.本发明通过减少原方案的字根、取消不符合汉字规范的“自造”字根、尽量采用传统部首、设计双码部件、增加部件、重新设计部件区位以及细化笔画形态等措施,形成了一个符合汉字规范的用于编码和输入的部件体系(图1,图2)。
图1显示本发明全新的部件体系;
图2详列了本发明的部件体系与现有技术的根本不同。
(1)本发明针对汉字的现代规范字形而设计,为了使部件的优选与确定符合汉字的结构规律和规范教学的要求,特按照国家语委对汉字规范化的要求以及著名文字学专家的意见,以下面几项原则作为理论指导
①字源分析法经对汉字部件进行字源分析,根据汉字的造字法选取与主部件属于同一字源的部件作为“同源部件”,并将同源部件紧列在主部件之后,如
“忄”、“
”与“心”同源,被选用,并列在“心”后;

”、“
”与“止”同源,被选用,并列在“止”之后;

”与“米”同源,被选用,并列在“米”之后;
依此选取符合汉字构字规律和教学规范的部件。
②字素分析法字素分析法指汉字的构字法,部件的选取如果完全按照字源分析法,则未必适用于现代汉字字形的认识。如“颖”字,从“禾”,“顷”声,按字源法应分为“禾”和“顷”,按字素分析法,则应分为“匕禾_贝”等4个部件。
③综合运用原则部件的选取尽可能选用传统部首,传统部首如因键位限制不能入选为整字部件时,也不能拆成几个“自造”的部分,既要照顾到规范化,又要合理地设计编码。
④习惯约定原则独体字“果”未能入选为部件,按字源,应拆成“田木”两个部分,但按“笔画不能切断”这一习惯,“果”只能拆成“日木”两个部分,可谓约定俗成。
⑤系统规定由于编码空间的限制以及部件相容性的考虑,本发明对部件作出了本系统独特的规定如“双码部件”的设计以及补加“识别码”的规定,既保证了部件的规范化,又合理地设计了键位和编码,使系统在“小键盘、规范化”方面获得了突破性进展。
(2)按照(1)中的理论指导,本发明取消了原方案中构字能力差的以及不符合汉字规范的“自造”的以下16个字根(图3)
戋、弋、
_、_、
_、
在本发明中它们之中的一部分分别按以下方式分解为部件或笔画,如
戋一戈, 弋
丶,亠口
丶,ク
(3)按照(1)的理论指导,本发明在现行五笔字型字根的基础上新增以下25个整字或传统部首作为部件(图4)
_、戊、豸、隹、氏、母、气、爿、不、耒、酉、革、皮、舟、牜、飠、犭、鱼、羊、
_、礻、衤、艮、
经过对这些部件放入各键后对重码、谐调性等参数的影响进行浩繁的计算,本发明将上列前8个部件分别设计在以下键位上
_——21,戊——13,豸——33,隹——34,氏——33,
母——55,气——32,爿——42
(4)按照(1)的理论指导,本发明新设计了与主要部件同源的、或形似变形的、或便于联想记忆的以下35个部件,并分别安排在以下所示的键位上(图6)
——12
——13
覀 ——14
——21
廾 ——15日
——22
——24
——25

用 ——33_
——35
_
氺 ——43
——44
爿 ——42_
——53
ユ ——51
匕七——55
(5)本发明新增加了以下用于繁体字编码的部件11个,当不使用这些部件时,本发明就成为只处理简体字的技术;当使用这些部件、而不使用与之对应的简体部件时,本发明便成为只处理繁体字的技术;当简体、繁体部件同时使用时,本发明就成为既可以处理繁体又可以同时处理简体的技术(图7)。
車 貝

魚 言 門 馬 糹
(6)按照(1)的理论指导,本发明为了使汉字的拆分直观易学,还规范明确了单笔画拆分时的不同形态,并在码本中直观地标示出来,以便于中小学生拆分汉字和学习编码输入时对比使用(图8)。

丨亅
丿
_ 丶

_


_乚
_


(7)本发明将55(X)键的键名由“纟”改为“幺”,将51(N)的键名“已”改为“己”,以便于称谓和记忆。
(8)按照(1)的理论指导和部件选取符合教育规范的要求,本发明中构字能力低的部件、新增传统部首、双码部件以及同源、形似、变形部件,除了还可以在教学和实用过程中做小幅度的增减之外,整个的区与整个的位之间,必要时还可以作整体对调。
2.本发明创造性地提出了“双码部件”的设计,这一设计是解决小键盘输入方案中整字部件不能太多这一突出矛盾的技术突破既保证了传统部首在部件总表中的完整性,合理地分配了编码空间,又明显地改进了键面设计,使之符合规范,更加实用。
本发明取消了现行方案中“
_、
_、
_、
”等非传统部首,而用传统部首和整字束、酉、革、皮、舟、牛、飠、犭、鱼、魚、羊、
_、礻、衤、艮、
等“双码部件”取而代之。为了使这些部件在键盘上的排列不但符合规律性要求,又能够合理地分配编码空间,不致于因这些部件在键盘上因享用一个键、一个码而“独霸一方”,从而导致大量增加重码,本发明采用机助设计,经过大量的统计、分析、测试、研究、计算和反复的试验比较,确定
将“革、礻、衤、皮、犭、牜”等18个传统部首分别按其“朱笔笔画特征”或“末笔笔画的结构特征”定义为“双码部件”(图5),即
本发明中“双码部件”的数目可多可少。本发明提出并设计“双码部件”的意义在于
①使部件与传统部首保持一致、保持完整而不被拆分,而且符合文字结构传统,不给中小学生增加不认识、不规范的笔画结构,因而便于学习和使用,有效地缩短培训时间。
②使键盘设计更加简明合理,符合构字规范,使拆字击键与认字写字的传统习惯保持一致,操作方便,提高效率。
另外,依据本发明关于“双码部件”的设计方法,在简体字范围内为了进一步减少重码,“双码字根”的数目实际上还可增加,可以进一步将占据汉字拓扑图形左部和上部、组字较多(如超过25个汉字)、引起重码太多的传统“部首”也确定为“双码部件”。例如,可以依照“双码部件”的方法再将以下“部首”扩展设计为“双码部件”
依据本发明,当处理繁体字时,特别是处理CJK10646中20902个汉字或更大集合的汉字时,“双码部件”的数目还可以再增加
依据本发明,“双码部件”的两个码,在减少重码和合理分配键位负荷成为主要矛盾时,同时考虑方便记忆的情况下,第二个码的确定,在依据部件的笔形特征的前提下,可以比较灵活。如“舟”的两个码,既可以是“31、33”(TE),也可以是“31、41”(TY);“羊”的两个码既可以是“42、13”(UD),也可以是“42、21”(UH)。前者是依据末笔所在的笔画组的笔形,后者则是依据末笔画。
本发明所创造的双码部件是一个新的技术方案,它完全不同于现有技术“郑码”中的“多码字根”
本发明的“双码”与郑码的“多码”比较
本发明的“双码部件”在应用时,在键盘上或者说明书中均以完整字根的形式表示,特别是对于一开始就学习使用本发明的学习者。
然而,对于学习使用过原方案的人,有时为了使原方案与本发明尽快衔接过渡,或者为了照顾一部分使用者的个人方便,本发明的一切“双码部件”,仍然可以被“强行”拆作两个包含有不规范“部件”的两个部分,并分别按其“双码”中的第一码与第二码将该两个部分安排在相应的区位(键位)上,如
一般情况下,“强行”拆分结果中出现的非规范部件的编码和键位,与使用“双码部件”并无不同。但有时为了更为合理地分配键位负荷,或更为合理地将双码中的第二个码设计在整个编码空间中比较不“拥挤”之处,也可以给非规范部件“人为地”指定一个编码,就相当于把非规范部件人为地设计在某个键位上。而且,根据编码空间合理分配及部件相容性的需要,一个双码部件有时可以人为地依形“强行”拆分成2种甚至3种结果,如上表中的“不”和“舟”所示,这种情况叫“系统约定”。
这样,就形成了一个便于从“不完全规范”过渡到“完全规范”的“过渡性部件集合”、“过渡性编码体系”、“过渡性部件总表”及其键盘。为便于从原方案过渡到本发明,从实用的角度出发,这一点对于本发明也是许可的。
依据本发明,在对汉字拆分提取“编码部件”之后,当“原码序列”不足4个码时,应补加末笔字型识别码(下表中不列出)
a、“编码部件”为2时b、“编码部件”为3时c、“编码部件”为4时
输入码2是4个编码部件各取第一码,即无论双码部件有几个,一律取ABCD。这一种取码方法的优点是对重码的离散效果好,重码少,缺点是对“原码序列”来说,不是顺序取码。所以,以上两种取码法使用时,只择其一种。当处理CJK10646大字符集时,为减少重码,以第二种方法为好。这一方法有时也可以用于三个编码部件的情况。
以此形成的双码部件的编码规则和双码部件输入法;
3.本发明依规范化的要求,创造性地提出“根序优先、笔顺规范、尽量取大、兼顾直观”作为编码拆分的总则,使汉字输入与汉字教学规范、书写规范兼顾,与以上关于双码部件的编码规则一起,形成了新的编码体系(图9)。
笔画构成部件,部件构成汉字,汉字构成词语。笔画、部件、整字是汉语文字在输入电脑时的“三个层次”。
本发明将所选取的构字单位统称为“部件”。实际上是构成汉字的“零件”。
本发明对汉字拆分的总的规范化指导思想是汉字拆成部件,部件拆成单笔画。
书写汉字时,人们重视的是笔画的顺序——笔顺——即书写顺序。
键入汉字时,人们重视的是字根的顺序——根序——即键入顺序。
在大多数情况下,“笔顺”与“根序”在汉字中是完全一致的。
如“树”、“总”、“词”、“戆”等,它们的字根(部件)顺序与其笔画顺序是完全一致的。
然而,当把“包围型”及“套迭型”汉字拆分成一串“部件序列”时,“笔顺”与“根序”就常常发生矛盾。
如“国”
笔顺为丨_一一丨一丶一
根序为口王丶
其中,“国”的最后一个笔画“横”,被字根“
”“带”到第一个部件上了。
再如“束”
笔顺为一丨_一丨丿_
根序为木口
其中,第四笔写成的“口”的末笔,被部件“口”“带”到第二个部件里,而在“口”之后书写的“丿_”反倒被“木”“带”到第一个部件里了。
拆分输入时要依照根序,而汉字教学中又强调笔顺规范,这两者的矛盾,在现有的形码编码方案中,包括“五笔字型”现有技术中,一直没有一个能应付所有情况的统一的规则,因而使拆分普遍存在着任意性、多义性,既无法与教学“接轨”,又不能提高编码的质量。
为了解决以上矛盾,本发明提出“根序优先,笔顺规范,尽量取大,兼顾直观”作为一条拆分总则。即在“根序”与“笔顺”发生矛盾时,优先按“根序”取码,当需要拆成单笔画时,则严格按照规范的书写顺序进行。
在将汉字拆分成部件时,要尽量拆成最大的已知部件;如不能形成已知的最大部件,可以拆成较小的已知部件;如不能形成较小的部件,则拆成单笔画,此即“尽量取大”。
当一个独体字被拆成字素或部件时,应以拆出的部件直观性好为优选拆法,如“自”既可以拆成“
_三”,也可以拆成“丿目”,但后者直观性好,故本发明取后者,此即“兼顾直观”。
这一规定的意义在于既能使部件的拆分符合汉字构字的规范和传统。又能使笔画的拆分符合教学规范,便于汉字输入技术进入中小学汉字教学之中。
按照“根序优先、笔顺规范、尽量取大、兼顾直观”的拆分总则,本发明字、词的拆分取码输入规则如下
①键名编码及输入法
依据本发明,每个键位上一组部件中,可选一个有代表性的部件作为该键位的键名,键名既可以沿用现行五笔字型技术中将本键连打四下输入键名汉字,
如禾禾禾禾禾,(31 31 31 31,TTTT)
也可以不按打四下输入,而将键名作为“成字部件”输入,
如禾禾丿一_,(31 31 11 41,TTGY)
②单码部件编码及输入法
依据本发明,成字部件中非双码部件的单码部件,其输入法是
部件区位码+首笔单笔码+次笔单笔码+末笔单笔码。
如果按以上输入不足4个码,则要在前后补打空格键以完成输入。
依据本发明,单码部件还可以采用拆成单笔画后取其中某几个笔画以及根据编码空间分布定义或半定义的办法为之设计输入码。
③双码部件编码及输入法
依据本发明,其双码部件的编码及输入法有4种可分别单独使用或同时使用其中几种的编码输入方式。
a)直接以双码部件的2个码作为输入码
如革15 12(AF)
b)双码中的第一码+第二码+首笔单笔+末笔单笔
如革15 12 11 21 (AFGH)
c)双码中的第一码+首笔单笔+次笔单笔+末笔单笔
如革15 11 21 21 (AGHH)
d)在双码部件的两个码前边加前缀码,或后边补加后缀码,或前后同时加前缀码和后缀码形成输入码输入
如“革”的双码为15 12 (AF)
加前缀革24 15 12(LAP)
加后缀革15 12 24(AFL)
同时加前缀和后缀码革24 15 12 24(LAFL)
用于前缀或后缀的那个码(字母),可以是编码空间中的空余码,即不致于因补加而产生重码的11~55(G~X)中的任何一个码,前缀码、后缀码也可以是同一个码。
e)拆成不超过4个的单笔画,不足4个时,补加空格键输入
如革一丨 丨 丨
④单字拆分编码及输入法
依据本发明,其简体和繁体汉字的拆分编码及输入流程见说明书附图9。
⑤词语编码及输入法
依据本发明,其包含有双码部件的词语编码及输入法为
a、两字词每字各取其单字全码的前2个码,共4码,
如经济纟ス氵文(55 54 43 41,XCIY)
b、三字词第一字、第二字各取其单字全码的第一码,再加第三字全码的前两码,共4码,
如计算机讠_木几(41 31 14 32,YTSR)
c、四字词四个字各取其全码的第一码,共4码,
如科学技术禾_扌木(31 43 32 14,TIRS)
d、多字词取第一、二、三及最末一个字的全码的第一个码,共4码,
如中华人民共和国口亻人口(23 34 34 24,KWWL)
⑥单笔画输入法
根据本发明,5种单笔画的编码和输入方法是将所在的键连打两下再补加2个定义码
一11 11 24 24(GGLL)
丨21 21 24 24(HHLL)
丿31 31 24 24(TTLL)
乙51 51 24 24(NNLL)
其中定义码可以是24(L)以外的其它编码,可以是一个也可以是2-3个;
⑦末笔交叉识别码
依据本发明,其“末笔字型识别码”可以全部直接沿用现行五笔字型技术中的“5种末笔×3种字型”计15个识别码,也可以将上下型与杂合型进一步归为一种,即将字型进一步减少为“左右型”以及“非左右型”2种。此时“末笔字型识别码”则有以下10种
左右型11(一,G),21(丨,H),31(丿,T),41(_,Y),51(乙,N)非左右型12(二,F),2 2(||,J),32(
,R),42(
,U),52(ㄍ,B)
另外,依据本发明,为进一步简化“末笔字型识别码”,
可以只将1型字(左右型)按上述方式补加识别码,而非1型字不加“识别码”,此时,识别码只有5种
11(一,G),21(丨,H),31(丿,T),41(_,Y),51(乙,N)。
对于不足4个码的字来说,这一点在实际上,就等于凡1型(左右型)的字补加一个末笔画而已,而非1型(左右型)的字,则只输入其部件码。这一情况是“识别码”这一创造的最简化的实施例。
⑧高频字
本发明各键位上的高频字,既可以保留原方案,也可以按照汉字的频度重新选定。
4.本发明依据符合汉字规范的部件体系和人机工程学原理,采用机助手段,定量计算部件体系各部件的构字频度、各部件的实用频度、动态重码率、静态重码率及各键位的静态负荷、动态负荷,运用调整部件键位及拆分规则相结合的方法,使部件共容一键的相容性、部件键位分布的规律性、击键时手指的谐调性等三个目标,在更高的水平上达到了谐调统一,形成了符合汉字规范、科学、实用的输入键盘(图10,图11)。
众所周知,计算机汉字输入法及其键盘的设计,其所以举世称难,盖因它是一项涉及到语言文字学、信息论、计算机科学和人机工程学的全新的交叉科学。只有将诸多学科的理论同时运用并加以创造,才有可能创造出真正科学化、实用化的汉字输入技术。
五笔字型问世之后,本发明人对自己1978年——1995年长达16年的理论探索和科研实践加以总结,创造性地提出了在符合汉字规范的情况下,保证一项形码设计具有科学性、实用性的“形码设计三原理”,即
A.相容性原理
指若干个部件共容一键时,对重码率的影响,即对编码“唯一性”的影响。相容性越好,引起的重码越少。研究过程中,“相容性”常常直接用量化为重码的字数来表示;
B.规律性原理
指部件在键盘上排列布局的易学性。规律性好的排列布局便于记忆,容易掌握。一般来说,规律性是一个可以体会但很难量化,因而很难评价的软指标。在这里,本发明人创造了一种方法,即将设计者提出的部件在键盘上排列的“规律性”,量化为表示相对值的数字。在本发明中这种量化值是
据此,可以计算出任何一个部件的“规律度”。双码部件的“规律度”可按其两个码的“规律度”相加取平均值计算。
本发明部件的静态“规律度”平均值为G=7.42(图12)
原方案字根的静态“规律度”平均值为G=7.26(图13)
由此可见,本发明比原方案部件(字根)布局的规律性明显提高。
部件的“规律度”,作为一项重要的理论指标,对于一个形码设计来说,是衡量其学习难易程度、评价其优劣的极为重要的数据。方案调整优化的一种追求,部件排列的规律性改进,就是要使“规律度”这个值增大。
“规律度”可分为静态和动态两个值。静态值是只考虑部件的构字频度计算出的各部件的规律度;动态值则是按照《汉字频度表》将静态值加权计算出的规律度。
C.谐调性原理
指手指击键的负荷分配、击键时各手指动作的相关性和谐调性。
谐调性的研究是一个非常复杂的人机工程学和工程心理学问题。无论是形码或是音码设计,谐调性的研究和应用,对于输入效率都会产生重大的、根本性的影响。
众所周知,打英文的字母键盘,被近来证明是一个效率很低但因“木已成舟”不能更改的设计。鉴于汉字输入键盘目前还没有定型,所以一开始就设计效率高,即谐调性好的键盘,便具有重大意义甚至深远的历史意义。
为了使本发明的键盘设计在科学的理论指导下达到良好的谐调性,本发明通过大量的统计研究并根据工程心理学的试验数据得出结论
①同一个手单个手指的敲击运动间隔平均为0.09秒(同指连击);
②同一个手的不同手指敲击运动间隔为0.03秒(同手异指轮击),平均击键次数为单手单指时的3倍;
③不同手的手指之间敲击运动的间隔为0.02秒(左右轮击),平均击键次数为单手单指时的4.5倍。
而且,通过上千人次的实验测出,人的各个手指连续敲击的频率如下表所示(每分钟次数)
这一研究表明,一个谐调性好、效率高的输入键盘,应当做到
①充分发挥食指、中指的功能;
②要减轻双手小指的负荷;
③尽量避免单手单指打键;
④部件拆分及编码设计要尽量实现左右手交替击键。
“三原理”是一个三者互相影响的多目标。当强调某一个目标时,其它两个便会减弱。如特别强调规律性,即特别重视易学性,则重码必然增加,谐调性必然被破坏。因此可以在三者总体协调的情况下,对同一个部件集合设计出许多个利弊取舍有所不同的实施例来。
依据关于汉字规范化的要求以及上述“形码设计三原理”,本发明符合汉字规范的键盘设计依照以下方法进行并具有以下特点
(1)采用符合汉字规范的部件体系形成符合汉字规范的键面布局
①消除了“自造”部件“
_、_、
_、
_、
”等非规范笔画结构。
②增加了传统部首”不、耒、酉、革、皮、舟、牜、飠、犭、鱼、魚、羊、
_、礻、衤、艮、
”等作为“双码字根”。
③增加了传统部首“_、戊、氏、豸、母、隹、气”等作为“整字部件”。
④将同源部件、变形部件、或形似部件“
爿、_、
_、
”等设计在键盘上。
⑤将折笔“乙”的不同形态表示在键位上或键盘上。
以上措施不但使部件规范化,键面布局、键盘设计规范化,而且使部件的平均“规律度”得以提高。
根据规范化的要求和实践经验,键盘上的传统部首、双码部件、同源部件、形似部件和变形部件还可以适当增减。
(2)依据部件拆分输入时对指法谐调性的影响,设计部件并分配其键位,使输入时手指的谐调性显著进步,有利于减轻录入员的疲劳并提高输入速度
①关于“
”和“_”——减轻A键负荷的设计
原方案中无“_”,遇到“_”输入时,就要拆分为2个部件
_——
七(21 15,HA)
因此,凡输入含“_”的字,必然要用最“低能”的左手小指击A键。本发明设计了“_”之后,使左手小指的负荷减少。而且“_”仍处在21(H)键,使规律度仍然为8,不受任何影响;
②关于“母”——避免下、中、上三排击键
原方案中无“母”,遇到“母”,就要拆成3个部件
母——

(55 11 42,XGU)
而“XGU”分别在三排键上。故输入时必然要击三排键,不但容易出错,而且影响速度。
本发明增加“母”后,改善了负荷分配,使“每、海、敏、繁、梅”这些常用字的输入符合谐调性的要求,打起来“顺手”。
③关于“氏”——避免小指连击,转移小指负荷
原方案中无“氏”,凡含“氏”的字一律要拆为用同一小指击键的2个部件
氏——
(35 15,QA)
本发明增加整字部件“氏”后,明显减少小指连击QA的负荷,对于常用字“低、纸、底、抵、婚、昏”等字来说,手指的谐调性大为改善,从而提高输入速度、减少错误击键,降低错码率。
虽然将“氏”设计在“33”上因“次笔不符合位号”而使“规律度”减少了4,但这一牺牲却大大改进了谐调性,因而是值得的。
在本发明总的指导思想之下,采用相同的方法,还可以根据规范化的要求,再调整若干个部件的键位,而使谐调性在与相容性、规律性三者的利弊权衡中作新的取舍而成为新的实施例。如还可以为了减轻45(P)的负荷,将“礻、衤”移到44(O)键上,为减轻A键负荷,将“工”移到12(F)键上等等。
(3)本发明卓有成效地合理分配了键位的击键负荷,使谐调性有重要进步
为了解决32(R)键和44(O)键平均击键负荷明显偏低而影响指法谐调性和输入速度的问题,对使用频度和构字频度都相当高的常用的3个部件——几、乂、广,用机助的方法,通过对该3个部件所涉及的348个字的编码构成、实用频度及其对键位负荷、重码率、规律性的综合影响等参数,进行计算对比和权衡,本发明将该3个部件设计在如下键位上
将“几”从25(M)键移到32(R)键;
将“乂”从35(Q)键移到32(R)键;
将“广”从41(Y)键移到44(O)键;
以下表格定量地表示以上设计对键位负荷、重码数及规律性的影响
几、乂、广的键位设计对相容性、规律性、谐调性的影响对比表
以上表中,重码组数栏1-1指一级汉字间的重码,1-2指一级字与二级字之间的重码;2-2指二级字之间的重码。
由上表可知,一个涉及一大批汉字的部件的移动,常常对“三原理”同时产生影响。
为了更为详细具体地介绍为部件重新设计键位的目的、方法及其效果,现以部件“广”从41(Y)键移到44(O)键前后对重码的影响为例,来说明这一设计除改善键位负荷之外,对相容性还作出了很大的贡献(以下字后边的*代表一级字,**代表二级字)
①“广”在41(Y)键上时所引起的重码
1.5959 圹 FYT ** 2327 坊 FYT *
2.3602 蘑 AYSD * 6234 蘼 AYSD **
3.8566 踱 KHYC ** 8583 躞 KHYC **
4.3550 靡 YSSD * 3605 磨 YSSD *
5.3473 麻 YSSI * 8767 縻 YSSI **
6.3607 魔 YSSC * 8765 麽 YSSC **
7.2987 谨 YAKG * 6659 廑 YAKG **
8.5105 鹰 YWWG * 5863 谶 YWWG **
9.5568 率 YWWF * 5589 座 YWWF * 10.2567 广 YYGT * 2329 方 YYGT * 11.5527 谆 YYKB * 3210 廓 YYKB * 12.3314 廉 YUVO * 3911 谦 YUVO * 13.3346 廖 YNWE * 3593 谬 YNWE * 14.5887 邝 YBH ** 5890 邡 YBH ** 15.2493 庚 YVWI * 6655 庾 YVWI ** 16.7094 纩 XYT ** 2336 纺 XYT *
以上重码共有16对,重码字共有32个
其中一级字共有20个,二级字共有12个
其中1-1重码=6,1-2重码=8,2-2重码=2
②“广”设计在44(O)键上后所引起的重码
1.3602 蘑 AOSD * 6234 蘼 AOSD **
2.8711 鳙 QGOH * 3359 鳞 QGOH *
3.3550 靡 OSSD * 3605 磨 OSSD *
4.3473 麻 OSSI * 8767 縻 OSSI **
5.3607 魔 OSSC * 8765 麽 OSSC **
6.4505 庭 OTFP * 1858 糙 OTFP *
7.2493 庚 OVWI * 6655 庾 OVWI **
以上新重码共有7对,新重码字共有14个
其中一级字共有9个,二级字共有5个
其中1-1重码=2,1-2重码=5,2-2重码=0
部件“广”共计涉及了117个汉字,“广”的移位虽然牺牲了一部分规律性,从首二笔完全与区位一致的“41”移到了只有首笔与区号符合的44键,使规律度减少了4,下降了一个级别,但这点牺牲换来的却是
a.相容性更好使由“广”引起的重码总数从16对降为7对,其中一级字之间的重码就减少了4对;而且从以上所列重码可见,移后仍存在的2对一级字间的重码“靡、磨”和“庭、糙”中,只有一个字“庭”是常用字。这对于部件的相容性即输入时的“唯一性”来说,无疑是一个很大的贡献;
b.谐调性大为改善将原来由右手食指(共控制6个键)本来就偏重的静态负荷0.26%(动态负荷0.2%)到右手无名指控制的44(O)键上来,使44(O)键原来太轻的动态负荷从1.33%明显上升到1.69%,这样就会明显改善右手的谐调性,必将减轻操作员的疲劳程度而提高输入效率。
由此可见,移动构字能力强、实用频度高的部件,以实现规范化、科学化的要求,与移动构字能力弱、实用频度低的部件是根本不同的,前者涉及到复杂的多学科的理论和分析,旨要达到“多目标”的统一或定量对比权衡利弊,而后者则因为牵涉到很少、很不常用的字,对重码和谐调性的影响均无足轻重。
当然,依据“形码设计三原理”的以上设计,仅仅是在GWB部件体系之基础上,依据“三原理”的一组实施例。同理,依照相同的方法,还可以在本发明的基础上继续改变若干个部件的键位而成为另外的一些实施例。例如把“力”移到53(V)键上或再减少增加少量部件等。
(4)本发明通过对“形码设计三原理”的研究和应用,突破性地解决了部件区位分布中相容性、规律性对谐调性的制约,实现了键位负荷的重新分配,使本发明的谐调性设计达到了空前的高水平
本发明通过部件的优选和布局以及拆分规则的确定,合理地重新分配了各个手指的击键负荷,使
①上排下排的手指负荷减轻;
②同一排中,左右两端特别是左右手小指的负荷减轻;
③使上排跨排到下排连击以及从下排跨排到上排连击的负荷减轻。
依据本发明的键盘及编码体系和《汉字频度表》,可以计算出本发明各键的击键静态负荷,与原方案和郑码可作以下对比
表中,原方案指当前流行的五笔字型四版。郑码的码本,来源于北京中易电子公司1993年2月印制的“郑码”《标准型使用手册》中的“郑码”码本,用同一软件计算得来。
由以上对比数据可以明显地看出本发明在键位负荷方面的优越性和突出进步。表中的三个方案中
①本发明的中排负荷最高,即手指导键(原始位置)的负荷高,平均手指行程最短,便于击键,能够提高效率;
②本发明的下排键负荷最低,使手指弯曲缩回击键的负荷减轻,能够提高效率;
③本发明上排负荷略高于其它两个方案,是由于从下排移入了一部分负荷,向上排伸指击键比下排缩指击键效率更高。
为了定量地考虑部件组字频度与键位负荷的关系达到科学设计的目的,本发明计算出了各部件的动态和静态负荷(图14)。
5.GWB部件体系在键位上的布局,可以有以下三种方式
(1)简体方式键位图上只列出简体部件,此时,本发明适用于输入简体字、词的情况;
(2)繁体方式当某个部件有简体、繁体两种形式时,只列出其中繁体形式的键位图,则只适用于处理繁体字、词的情况;
(3)简繁并行方式全部部件的简体、繁体都列在键位图上的方式即为简繁并行方式,用这种方式可同时输入简体字和繁体字。
当用以上(1)时,通过软件可以把输入的文本由简体转换成繁体;当用以上(2)时,通过软件可以把输入的文本由繁体转换成简体;
以上功能即谓“简繁并行、兼容互换”。
6.本发明将部件总表中的所有部件分为笔形、键名、部件、双码部件四大类(图15)
例如42(U)键的情况
这一分类是为了达到易学之目的而设计的。
7.本发明同一区位(键位)上的部件,以主部件为开头分组排列(图16)
本发明从每一键位上的笔形、键名、部件之中,各选出若干个典型代表作为主部件,这些主部件,连同与之同源、形似或便于联想记忆的部件,以键位为单位,各自排列成为一个由主部件打头的序列。在列表或在键盘上表示时,主部件的字号可大于“同位部件”、“同位件”。这一方法可以大大地减少记忆量,缩短学习周期。
例如15(A)键上的字根的情况是
而33(E)键的情况是
8.本发明可以形成简繁通用的“GWB”汉字排序法、汉字检索法及其检索装置。
依据本发明,当对汉字进行编码之后,便可以依汉字的“GWB”编码对任何汉字集建立字库、语料库或文件库,并按本发明的编码法进行排序检索。这种检索,既可以按部首或部件的区位码(11~55)进行,也可以按部件在英文标准键盘上对应的25个字母(A~Y)。由此,便必然可以由本发明产生出一种实用化的汉字字典、字库、文献的“GWB”排序法和查字法、检索法。当本发明纳入中小学教育之后,“GWB”检索法将会获得广泛应用。由于“GWB”是完全依形编码,所以“GWB”排序法、检索法可以通用于简体字和繁体字。
将此排序法、检索法通过软件用于具有输入键盘、字库、显示屏的系统上,该系统即成为GWB检索装置,可广泛地应用于图书、档案、信息检索之中(图15),其步骤是
(1)、在GWB编码体系的键位上敲击部件所对应的键位之后,键盘即输出部件所对应的编码或代码,其中“双码部件”所在的键位,在敲击相应的“双码部件”之后即输出相应“双码部件”所对应的编码或代码,该对应的编码或代码,通过软件被传输到相应的字库、词语库中进行检索;
(2)、GWB具有传统部首、同源部件、形似部件、变形部件及“双码部件”的输入键盘具有简繁汉字互换的功能,该互换功能对应于相应的简繁汉字的字库,进行相应的简繁汉字的单字检索;
(3)、GWB键盘的区位码相对应设定有与传统部首、同源部件、形似部件、变形部件及“双码部件”相关联的字库、词语库,该字库、词语库与上述键盘的部件的区位码相对应,检索包含有上述部件的单字和词语;
(4)、GWB键盘的区位码和相应的字、词库的指令相对应,显示根据键盘部件的区位码所对应的包含有上述传统部首、同源部件、形似部件、变形部件及双码部件的字、词的显示屏;
9.本发明将显示器、主机、汉字资料库、打印机联结成硬件系统,利用在不少于25个键位的以5区各5位共25个键位分配汉字部件构成五笔字型键位分布的键盘,或利用类似窗口式显示,可以方便地进行汉字资料检索的系统,其步骤是
(1)、在5区5位共25个键位上,以11,12,……54,55作为每一组部件的区位码,以传统部首、同源部件、形似部件、变形部件以及“双码部件”形成与键位一一对应的部件体系;
(2)、以上述部件体系,将汉字以“根序优先,笔顺规范,尽量取大,兼顾直观”的拆分方法拆分为部件序列,取其最多第一、第二、第三及前后一个部件作为输入编码部件,以该部件所在的区位或其代码作为其输入代码,不足4码的补加识别码而形成的检索输入方法;
(3)、以上述检索编码体系,通过软件,自动地对任何汉字资料进行单字或词语排序,并利用该检索编码部件体系和检索编码输入方法对任何汉字资料进行检索;
(4)、通过键盘、显示器、打印机对上述检索结果进行编辑、显示与输出;
以此构成可用于图书、档案、信息处理的汉字排序及其汉字检索系统。
10.本发明所附的“五笔画输入键盘”在笔画分类上,将折笔“乙”明细在键位或附表上
11.本发明按汉字的实用频度显示重码 当输入某一汉字遇到重码字时,该字和与之重码的字按其实用频度从左至右显示在屏幕的提示行中,最常用的字显示在最左端,当需要这个字时,只要输入文件中该字后边的字,该字即可自动显示到编辑位置上去。当需要的字在第2、第3等位置上时,可用键盘上方的数字键挑选。
12.本发明智能处理重码当输入某一汉字遇到重码时,可视为没有重码,而利用机内已装入的词库及智能处理软件自动地判别下文输入的字与重码字之间的搭配关系,自动将重码字当中能与下文构词的那个字确定下来或补正过来。
13.本发明的输入装置可以是一个专门制造的中文键盘,也可以直接沿用一个标准的英文键盘,当是一个专门制造的中文键盘时,既可以是一个大键盘、中键盘之内包含有25个键的一个区域(图16),也可以是一个5排、每排5个键位的超小型键盘(图17)。
14.本发明通过对简繁汉字进行编码,编写输入软件模块,使用键盘向电脑或其它通讯设备输入汉字信息,通过软件和系统从字库中检索出所要输入的字或词,并将字或词显示在屏幕上或直接打印出来,以此形成一套汉字信息处理系统,该系统包括输入键盘、输入软件、操作系统、字库、词库、主机、显示器、打印机、终端及工作站等(图18)。
15.本发明由输入编码为主要内容的输入模块,可以适用于并移植到各种电脑及信息处理系统上去。
16.本发明的部件集合、部件体系、编码体系、输入键盘、信息处理系统、还可以处理CJK10646大字符集或更大集合的汉字及其词语。
17.本发明较之现行五笔字型的显著优点和实质性进步在于
本发明取消了不符合汉字规范的“自造”字根,增加符合汉字规范的传统部首作为部件,设计符合汉字规范的双码部件,设计同源、形似部件,设计繁体部件,明确折笔形态,改变键名,与原方案相比,有以下优点和积极效果
①.部件(字根)体系符合汉字规范与原方案相比明显不同且具有显著优点
本发明与现行技术相比,取得了实质性进步,仅从改变拆分和编码的字数便可以从下表看出
本发明与原方案拆分编码异同比较表
②.编码体系符合汉字规范,比原方案有质的进步和突破。
③.部件分区划位的规律性有明显提高,部件的平均“规律度”从原方案的7.26提高到本发明的7.42。
④.部件的相容性有实质性进步。
作为汉字编码学术界的常识,人们知道,在键数一定的前提下,部件拆得越“碎”,越不易产生重码;反过来,部件越“大”,越是容易引起重码。而本发明在对现行方案作如此大幅度改进、增加了20多个符合汉字教学规范的传统部首作为部件,在规范化方面取得了如此实质性创新的情况下,总的重码不但没有增加,反而有明显降低了19对,这是不经过长期认真研究反复探讨就不可能达到的一个新水平、新高度。
⑤.部件分区划位及键位设计符合人机工程学原理,输入击键的谐调性有重大进步,可以减轻录入人员的疲劳、减少差错、提高输入效率。本发明与原方案各键位动态负荷对比如下,表中各键上边一排数据为原方案的,下边一排为本发明的
本发明与原方案各键位动态负荷对比表(%)
从以上对比可以看出,最“无能”的左手小手指控制的35(Q)、15(A)的负荷明显下降;原方案中负荷太轻的44(0)键和32(R)键的负荷则明显上升,本发明无论是静态负荷分布还是动态负荷分布,都明显地优于原方案。鉴于到目前为止国内还没有报道过为设计输入技术量化计算键位负荷的实例,还没有计算部件负荷与键位负荷的先例,所以可以说,在实现手指击键的谐调性方面,本发明取得了空前的进步。
⑥.键盘设计符合汉字规范和人机工程学原理,便于在中小学中普及应用。
本发明是在国内外中文电脑信息处理技术迅速发展、广泛应用、迅速进入教学、进入家庭的情况下应运而生的。在当前“五笔字型”已在中文输入技术中占据主导地位的情况下,本发明及时而有效地克服了“五笔字型”在规范化、科学化、实用化等方面明显存在的问题,使本发明能够在科学性、创造性、规范化、实用化等方面比现行方案有一个突破性发展。
本发明是一个系统工程,对于包括主机、显示器、输入键盘、打印机、字库、词库及软件等在内的系统进行了全新的创造符合教育规范的含有双码部件的部件体系、双码编码体系、双码键位键盘的创立,以及与双码编码体系之编码相对应的字、词库的设置和相应系统的确立,保证了本发明得以顺利实施,并如愿以偿地达到了所预期之目的——使五笔字型技术走向规范化、科学化和更加实用化,有更高的效率,有更为广阔的应用领域乃至在中小学校中普及。这些都是十年来发明人创造性劳动的成果。这一成果使得本发明与现行五笔字型技术即原方案相比,有着质的飞跃,使本发明成为可以在国内外直接进入中小学教育系统,实现规范化的汉字教学与规范化的汉字输入教学密切地结合起来,加上本发明对CJK10646大字符集的先进有效的处理,本发明必将成为在世界范围内简繁通用、简繁互用、字词共融的一项为弘扬中华文化做出重大贡献、有巨大社会意义的崭新技术。
权利要求
1、在不少于25个键的键位上以5区各5位分配部件和输入码的键盘布局,并依据最多取“一、三、三、末”部件编码输入汉字的一种教育规范五笔字型电脑汉字输入方法,其特征在于
(1)按照汉字规范教学以及字源分析、字素分析、综合运用、习惯约定、系统规定等优选、确定部件的原则,形成了一个符合汉字规范、符合教学规范、简繁并行、兼容互换的规范化五笔字型编码部件的集合。该编码部件的集合在于新增符合汉字规范的整字或传统部首作为部件
_、戊、豸、隹、氏、母、气、爿、不、耒、酉、革、皮、舟、牜、飠、犭、鱼、羊
、_)、礻、衤、艮(
);
(2)在上述读编码部件的集合中,将符合汉字规范的部分传统部首设计为“双码部件”,即将若干个传统部首的编码依其笔画特征和其编码在整个编码空间中分布的合理性设计为2个码,以此形成符合汉字规范的“双码部件”
不、耒、酉、革、皮、舟、牜、飠、犭、鱼、羊
、_)、礻、衤、艮(
);
(3)在上述部件集合中增加与主部件同源的、形似的、变形的或便于联想记忆的同位部件
覀、
廾、日、
月、
用、冖、
_、
氺、
爿、_、
匕、七
以此形成了符合汉字规范的部件集合;
(4)依据部件分组划位时的相容性,并以首笔与区号一致、次笔与位号一致的规律性、各区位的负荷分配与手指击键的谐调性三者实现多目标的统一为依据,将上述部件及其它部件的集合划分为5个区,每个区5个位,分别以11,12,13,……54,55作为每一组部件的区位码,以此形成的一个符合汉字规范并与键位一一对应的、可以对简体与繁体汉字以及CJKl0646大字符集进行拆分编码的部件体系
GWB部件体系在键位上的布局
(5)按照“根序优先、笔顺规范、尽量取大、兼顾直观”取一、二、三、末最多四个部件、不足四码补加识别码的方法形成汉字拆分编码的总则;
利用上述包括传统部首、双码部件、同源部件、形似部件、变形部件及其它部件的键位输入码的编码输入步骤为
A单字输入
①本身是部件的单字
a、单笔画单笔码+单笔码+定义码+定义码(或加一个定义码)
b、键名字将所在键连击4下,或按单码成字者输入或拆作2-4个单笔画输入
c、单码部件成字者区位码+首笔单笔+次笔单笔+末笔单笔
不足4码时,补空格键作为输入结束标记
或拆成2-4个单笔画
d、双码成字者有5种可分别使用或同时使用其中几种的编码输入方式
i)直接以双码部件的2个码作为输入码;
ii)第一码+第二码+首笔单笔+末笔单笔;
iii)第一码+首笔单笔+次笔单笔+末笔单笔;
iv)在双码部件的2个码的前边加前缀码或后边加后缀码,或前后同时加前缀和后缀码形成输入码输入;
v)拆成不超过4个的单笔画输入,不足4个时,补加空格键输入;
②非部件单字
一律依照“根序优先,笔顺规范,尽量取大,兼顾直观”的拆分总则,将其拆分成为单码部件或双码部件的序列之后
a、不含双码部件时
5个部件以上时,取一、二、三、末部件编码输入
4个部件时,取其全部部件依次编码输入
2~3个部件时,依次取其全部部件之后,补加“末笔字型识别码”,仍不足4码,打空格键作为输入结束标记;
b、含有双码部件时,上述符合汉字规范的双码部件参加拆分和编码输入时,按以下步骤进行
①取一、二、三、末部件即依部件拆分规则,以部件为单位将汉字拆分为“部件序列”,再从该“部件序列”中最多取一、二、三、末四个部件作为“编码部件”;
②将步骤①中被取中的“编码部件”所对应的区位码或英文字母依次列出,成为一个“原码序列”,其中如有双码部件时,双码部件的2个码都要列入;
③依以下三种情况从“原码序列”中取最多“一、二、三、末”四个码作为该汉字的正确编码即输入码;
三种情况的取码规则如下例所示其中以ABCD作为“一、二、三、末”部件的单一码或第一码,以WXYZ作为“编码部件”之中双码部件的第二码;当“原码序列”不足4个码时,还应如现行五笔字型技术那样补加“末笔字型识别码”;
a、“编码部件”为2时
b、“编码部件”为3时
c、“编码部件”为4时
输入码2是将4个“编码部件”各取第一码,即无论其中双码部件有几个,一律取ABCD;
B.词语输入
无论组成词汇的单字结构中是否含有双码部件,其词语的编码输入方法都一样,即都以其单字的全码作为取码的基础,其中
①两字词
每字各取其单字全码的前两个码共4码输入
②三字词
前2字各取其单字全码的第一个码、最后一个字取其单字全码的前两个码共计4码输入
③四字词
每字取其单字全码的第一个码共计4码输入
④多字词
取第一、第二、第三及最后一个字单字全码的第一个码共计4码输入;
含有双码部件的词语的编码输入法与不合双码部件的词语的编码榆入法相同,其步骤是以单字的全码为基础,分2字词、3字词、4字词与多字词分别按以上要求取码并输入;
以此形成的含有传统部首、双码部件、同源部件、形似部件、变形部件的部件集合、编码体系和输入法;
2、根据权利要求1的双码字、词编码输入方法,其特征在于,双码部件的编码输入也可以拆分为可能含有非规范部件的两部分后,分别编码并输入,此时,拆分中可能出现的非规范部件就相当于处在双码部件第二个码所指的键位上,或其它依据编码在编码空间中分布的合理性、相容性而依形人为地指定的键位上,即
不43——一
(11 43) 鱼 11——
一 (35 11)
——_ 卜 (13 21) 魚 44——
灬 (35 44)
耒43——三
(13 43) 羊 13—— 丷 _ (42 13)
酉11——西 一 (14 11)
13—— 丷 _ (42 13)
革12—— 廿
(15 12) _ 13—— 丷 王 (42 11)
皮54——_ 又 (21 54) 礻 41—— _ 丶 (45 41)
舟41——丿
(31 33) 衤 42——
(45 42)
丿、 丶 (31 41) 艮 33——彐
(53 33)
飠33——人
(34 54)
54——彐
(53 54)
犭31——
丿 (35 31)
以此形成从“不完全规范”过渡到“完全规范”的过渡性部件集合及其编码体系;
3、一种教育规范五笔字型电脑汉字输入键盘,其特征在于
在5区各5位的25个键位上设定有全新的编码部件,其中
(1)在以下键位上新增了符合汉字规范的整字或传统部首作为编码输入部件
13.D—戊 21.H——_ 32.R——气 33.E——豸
34.W——隹 35.Q——氏 42U——爿 55.X—母
(2)在以下键位上设计了符合汉字规范的“双码部件”
11.G——不 13.D——耒 14.S——酉
15.A——革 21.H——皮 31.T——舟、牜
34.W——飠 35.Q——犭、鱼、魚
42.U——羊、
_ 45.P——礻、衤 53.V——艮、
(3)在以下键位上设计了同源部件、形似部件、变形部件
12.F——
13.D——
14.S——覀
15.A——
廾 21.H——
22.J——日
24.L——
25.M——
33.E——


35.Q——_
42.U——爿 43.I——
_

44.O——
51.N——
ユ53.V——_
55.X——
匕七
(4)在以下键位上新设计了原方案中的部件
32.R——几乂
44.O——广
(5)55(X)键的键名设定为“幺”,51(N)键的键名设定为“己”;
(6)51.N键上的折笔“乙”同时代表
以此构成既可以输入汉字的简体字、词,也可以输入繁体字、词,并适用于处理CJK10646大字符集汉字的符合汉字规范的输入键盘;
4、包括显示器、主机、字库、词语库、打印机,并利用在不少于25个键位的以5区5位共25个键位分配汉字部件构成五笔字型键位布局的键盘,依据最多输入第一、第二、第三及最末一个部件或其编码完成单体与繁体汉字的单字和词语输入的一种教育规范五笔字型电脑汉字输入系统,其特征在于
(1)在5区各5位共25个键位的键盘的以下区位即键位上
a、增加符合汉字规范的传统部首作为整字部件,设计在如下区位上
_——21,戊——13,豸——33,隹——34,氏——33,
母——55,气——32,爿——42
b、在5区5位共25个键位的键盘的以下区位即键位上将同源部件、形似部件、变形部件归并于主部件所在的区位上
——12
——13
覀——14
——21
廾 ——15 日
——22
——24
——25

用 ——33 _
——35
_
氺——43
——44
爿——42 _
——53
ユ ——51
匕七 ——55
c、将构字频度和实用频度都相当高的常用部件“几”、“乂”、“广”依其在键盘上的相容性、规律性、谐调性三者的多目标统一设计在以下键位上
几——32(R) 乂——32(R) 广——44(O)
d、将“幺”定为55.Q的键名,“己”定为51.N的键名
e、将折笔“乙”代表如下笔形
f、在5区各5位共25个键的键盘的以下区位即键位上将符合汉字规范的“双码部件”设计在相应的区位上
在以上输入编码体系的键位上敲击部件所对应的键位之后,键盘即输出部件所对应的编码或代码,其中“双码部件”所在的键位,在敲击相应的“双码部件”之后即输出相应“双码部件”所对应的编码或代码,该对应的编码或代码,通过软件被传输到相应的字库、词语库中进行检索;
(2)上述具有传统部首、同源部件、形似部件、变形部件及“双码部件”的输入键盘具有简繁汉字互换的功能,该互换功能对应于相应的简繁汉字的字库,进行相应的简繁汉字的单字检索;
(3)与上述键盘的区位码相对应设定有与传统部首、同源部件、形似部件、变形部件及“双码部件”相关联的字库、词语库,该字库、词语库与上述键盘的部件的区位码相对应,检索包含有上述部件的单字和词语;
(4)与上述键盘的区位码和相应的字、词库的指令相对应,显示根据键盘部件的区位码所对应的包含有上述传统部首、同源部件、形似部件、变形部件及双码部件的字、词的显示屏;
5、一种包括显示器、主机、汉字资料库、打印机、并利用在不少于25个键位的以5区各5位共25个键位分配汉字部件构成五笔字型键位分布的键盘或利用类似显示窗口进行汉字资料检索的系统,其特征是
(1)在5区5位共25个键位上,以11,12,……54,55作为每一组部件的区位码,以传统部首、同源部件、形似部件、变形部件以及“双码部件”形成与键位一一对应的部件体系
GWB部件体系在键位上的布局
(2)以上述部件体系,将汉字以“根序优先,笔顺规范,尽量取大,兼顾直观”的拆分方法拆分为部件序列,取其最多第一、第二、第三及前后一个部件作为输入编码部件,以该部件所在的区位或其代码作为其输入代码,不足4码的补加识别码而形成的检索输入方法;
(3)以上述检索编码体系,通过软件,自动地对任何汉字资料进行单字或词语排序,并利用该检索编码部件体系和检索编码输入方法对任何汉字资料进行检索;
(4)通过键盘、显示器、打印机对上述检索结果进行编辑、显示与输出;
以此构成可用于图书、档案、信息处理的汉字排序及其汉字检索系统。
全文摘要
教育规范五笔字型汉字输入法及其装置,系现行五笔字型的发明人王永民教授又经十年研究,按照汉字教学规范的要求,运用人机工程学原理,采用字源分析、字素归纳、习惯约定、系统规定等方法,大量选用传统部首,创造双码部件,完全取消自造字根,以此形成一整套全新的部件体系、拆分总则、编码体系和全新的键盘设计,从根本上克服了原发明的严重缺陷,使本发明在科学性、实用性、规范化方面,创造性地全面突破并发展了现有技术。
文档编号G06F3/023GK1154502SQ9510593
公开日1997年7月16日 申请日期1995年6月9日 优先权日1995年6月9日
发明者王永民 申请人:王永民
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1