汉字部件笔顺编码法及其输入键盘的制作方法

文档序号:6602703阅读:347来源:国知局

专利名称::汉字部件笔顺编码法及其输入键盘的制作方法
技术领域
:本发明涉及一种汉字部件笔顺编码法和依据这一方法设计出的一种中文输入键盘。该发明属于中文信息处理
技术领域
。目前,在众多的汉字编码方法中,拼音编码方案和五笔字型编码方案(王永民,“优化五笔字型编码法及其键盘”,《发明专利申请审定说明书》,审定号——CN1003326B)是最具代表性的两种。前者利用了汉字的基本音素,接近人脑的思维习惯,简便易学,缺点是重码率太高;后者利用汉字丰富的字形信息,重码率很低,有利于实现盲打,缺点是编码规则与大众通常所具有的汉字知识脱节,使非专业汉字录入者难于掌握。而其它各种汉字编码方法均未能很好地兼顾低重码率和简单易学这两项基本要求。因此,进一步研究更加高效易学的汉字计算机输入方法已成为一项意义重大的课题。本发明的目的是提供一种具有较低单字输入重码率、词组编码资源丰富、好学易记的大众化汉字编码方法及其输入键盘。释义笔画——一笔形成的中文字符图形被称为笔画。独立笔画——在一个单字中不能归入部件的分离笔画被称为独立笔画。部件——由两笔及两笔以上笔画所组成的中文字符图形被称为部件,本发明确定了230种部件。子部件——被包含在某一部件内的部件即为该部件的子部件。顺序子部件——从部件(或整字)的首笔画依笔顺推行,出现的离首画最近的子部件被称为部件(或整字)的顺序子部件。逆序子部件——从部件(或整字)的尾笔画依逆笔顺倒推,出现的离尾画最近的子部件被称为部件(或整字)的逆序子部件。本发明的技术方案把汉字的基本构字部件确定为230种,把汉字的基本笔画划分为9种。用英文26个字母(不区分大小写)和“;”、“/”共28个符号分别作为笔画及部件的代码(见图一、图二),使本发明确定的基本部件和笔画映射到标准通用英文键盘的相关键位上,从而将普通英文键盘改造成一种中文输入键盘。将汉字按部件特征分为8类,(1)零部件类——每个汉字不能拆分出任何子部件,如,厂、才、七等;(2)一部件类——每个汉字可以拆分成一个部件与不能归入部件的独立笔画,如,百、白、三等;(3)水平二部件类——每个汉字由两个部件组成,部件结构为左右并列、中心重叠、四面包围、三面包围、二面包围,如,汉、束、困、闪、近、疗等;(4)垂直二部件类——每个汉字由两个部件组成,部件结构为上下排列,如,只、类、见、夺等;(5)二部件与独立笔画混合类——每个汉字由两个部件和不能归入部件的独立笔画共同组成,如,立、号、伸等;(6)三部件类——每个汉字由三个部件组成,如,部、硅、这、祸等;(7)三部件与独立笔画混合类——每个汉字由三个部件与不能归入部件的独立笔画共同组成,如两、添、舔等;(8)四部件及四部件以上类——每个汉字含有四个部件或四个以上部件,如,减、能、输等。零部件类汉字的编码规则为,首笔画代码+次笔画代码+尾笔画代码;对只有两笔画的汉字,第一、二、三码依次为首画代码、尾画代码、字的拼音首字母;对由一笔画构成的汉字,第一码为笔画代码,第二码为拼音首字母,没有第三码。例释“才”的第一、第二、第三笔画依次为“横(H)”、“左钩(G)”、“撇(P)”,其编码为“HGP”。“厂”的首笔画、尾笔画、拼音首字母依次为“横(H)”、“撇(P)”、“C”,其编码为“HPC”;“一”的首笔画为“横(H)”,拼音首字母为“Y”,其编码为“HY”。一部件类汉字的编码规则为,由部件代码和第一独立笔画代码按书写顺序组成前两码,拼音首字母作为第三码。例释“百”的第一独立笔画为“横(H)”,部件为“白(B)”,拼音首字母为“B”,其编码为“HPB”;“凡”的部件为“几(J)”,第一独立笔画为“点(D)”,拼音首字母为“F”,其编码为“JDF”;水平二部件类的汉字的编码规则为,首部件代码+尾部件代码+整字逆序子部件代码,若无整字逆序子部件,则第三码取字的尾画代码(对以“口”结尾的汉字,应将口所包围的字符的尾画作为整字的尾画)。例释“闪”的首、尾部件依次为“门(M)”、“人(R)”,没有整字逆序子部件,尾画为“点(D)”,其编码为“MRD”;“汉”的首、尾部件依次为“氵(I)”、“又(Y)”,整字逆序子部件为“冫(E)”,其编码为“IYE”;“过”的首、尾部件依次为“寸(C)”、“辶(/)”,没有整字逆序子部件,尾画为“捺(N)”,其编码为“C/N”;“疗”的首、尾部件依次为“疒(B)”、“了(L)”,整字逆序子部件为“冫(E)”,其编码为“BLE”。垂直二部件类的编码规则为,首部件代码+尾部件代码+整字顺序子部件代码,若无整字顺序子部件,则没有第三码。例释“类”的首、尾部件为“米(M)”、“大(D)”,整字顺序子部件为“丷(;)”,其编码为“MD;”;“见”的首、尾部件分别是“(A)”、“儿(E)”,没有整字顺序子部件,其编码为“AE”。二部件与独立笔画混合类汉字的编码规则为,由第一独立笔画代码及两个部件代码按书写顺序组成前三码,整字顺序子部件代码作为第四码,若没有整字顺序子部件,则取字的尾画作为第四码(对以“口”结尾的汉字,应将口所包围的字符的尾画作为整字的尾画)。例释“立”的部件和第一独立笔画按笔顺依次为“亠(E)”、“丷(;)”、“横(H)”,没有整字顺序子部件,尾画亦为“横(H)”,其编码为“E;HH”;“号”的部件和第一独立笔画按笔顺依次为“口(K)”、“横(H)”、“勹(G)”,没有整字顺序子部件,尾画为“左钩(G)”,其编码为“KHGG”;“伸”的部件和第一独立笔画按笔顺依次为“亻(/)”、“日(R)”、“竖(L)”,整字顺序子部件为“口(O)”,其编码为“/RLO”。三部件类汉字的编码规则为,第一部件代码+第二部件代码+第三部件代码+第三部件的逆序子部件代码,若第三部件无逆序子部件,则取字的尾画代码作为第四码(对以“口”结尾的汉字,应将口所包围的字符的尾画作为整字的尾画)。例释“部”的第一、第二、第三部件依次为“立(L)”、“口(K)”、“阝(E)”,第三部件没有逆序子部件,尾画为“竖(L)”,其编码为“LKEL”;“硅”的第一、第二、第三部件依次为“石(D)”、“土(T)”、“土(T)”,第三部件的逆序子部件为“十(S)”,其编码为“DTTS”;“泅”的第一、第二、第三部件依次为“氵(I)”、“口(O)”、“人(R)”,第三部件没有逆序子部件,字的尾画为“点(D)”,其编码为“IORD”。三部件与独立笔画混合类汉字的编码规则为,由三个部件代码与第一独立笔画代码按书写顺序组成一个四位码。例释“两”的三个部件和第一独立笔画按笔画顺序依次为“横(H)”、“冂(A)”、“人(R)”、“人(R)”;其编码为“HARR”;“添”的三个部件和第一独立笔画按笔画顺序依次为“氵(I)”、“天(T)”、“小(X)”、“点(D)”;其编码为“ITXD”;“舔”的三个部件和第一独立笔画按笔画顺序依次为“撇(P)”、“古(G)”、“天(T)”、“小(X)”;其编码为“PGTX”。四部件及四部件以上类汉字的编码规则为,第一部件代码+第二部件代码+次尾部件代码+尾部件代码。例释“减”的第一部件、第二部件、次尾部件、尾部件依次为“冫(E)”、“厂(C)”、“戈(G)”、“口(K)”,其编码为“ECGK”;“能”的第一部件、第二部件、次尾部件、尾部件依次为“厶(S)”、“月(V)”、“匕(B)”、“匕(B)”,其编码为“SVBB”;“填”的第一部件、第二部件、次尾部件、尾部件依次为“土(T)”、“十(S)”、“(Q)”、“八(B)”,其编码为“TSQB”。“输”的第一部件、第二部件、次尾部件、尾部件依次为“七(Q)”、“十(S)”、“月(V)”、“刂(D)”,其编码为“QSVD”。本发明公开了两种能分别与单字编码兼容的词组编码方法,其一是音形编码法,其二是全形编码法。音形编码法利用了拼音首字母来参与组词,尤其适合中文撰稿者在计算机键盘上直接输入其构思的文稿,音形编码法在理论上具有的最大词组编码空间为30万条;全形编码法主要采用部件和笔画来组词,尤其适合在计算机键盘上输入已有的文稿,全形编码法在理论上具有的最大词组编码空间为60万条。音形编码法和全形编码法互不兼容,不能同时混用在同一个汉字信息处理软件上。按照音形编码法,对于二字词,取两字的拼音首字母按字的先后顺序组成词的前两码,取两字的单字编码的第一码按字的先后顺序组成词的后两码;对于三字词,取三个字的拼音首字母按字的先后顺序组成词的前三码,取第三字编码的第一码作为词的第四码;对于四字及四字以上词,取第一、第二、第三、末尾字的拼音首字母按字的先后顺序组成相应的四位码。例如,“领先”的两个拼音首字母依次为“L”、“X”,两个单字编码的第一码依次为“R”、“N”,词的音形编码为“LXRN”;“马后炮”的三个拼音首字母依次为“M”、“H”、“P”,第三字编码的第一码为“H”,词的音形编码为“MHPH”;“壮心不已”的第一、第二、第三、末尾字的拼音首字母依次为“Z”、“X”、“B”、“Y”,词的编码为“ZXBY”。按照全形编码法,对于二字词,分别取两个字的前两码按字及笔顺的先后顺序组成词的四位码;对于三字词,分别取三个字编码的第一码组成词的前三码,取第三字编码的第二码作为词的第四码;对于四字词,取第一、第二、第三、末尾字编码的第一码组成词的四位码。例如,“领先”的两字前两码按字序和笔顺依次为“R”、“D”、“N”、“E”,词的全形编码为“RDNE”;“马后炮”三个字的第一码依次为“Z”、“C”、“H”,第三字编码的第二码为“G”,词的全形编码为“ZCHG”;“壮心不已”的第一、第二、第三、末尾字的第一码按字序依次为“L”、“D”、“C”、“A”,词的全形编码为“LDCA”。输入分号“;”时,依次敲击“;”键和空格键即可;输入斜线“/”时,依次敲击“/”键和空格键即可。本发明还提供了重码字的简码技术,其目的在于使多数重码字像非重码字一样,也具有与其它汉字互不相重的编码。具体实现的方法是,在每一组三位重码字和四位重码字中挑选出一个汉字,取被挑选汉字的前两位码元组成该汉字的二位编码,舍弃与某些汉字的二位全码相重的二位编码,也舍弃与其它重码字的二位编码相同而使用频率相对较低的汉字的二位编码,余下的重码字及其二位编码即构成一个二级简码字符集;从每一组四位码的重码字中挑选出一个未被选入二级简码字符集的汉字,取被挑选汉字的全码中的前三位码元组成该汉字的三位编码,舍弃与某些三位全码汉字的编码相同的三位编码字,也舍弃与其它三位编码字的编码相同而使用频率又相对较低的三位编码字,余下的重码字及其三位编码便构成了一个编码唯一的三级简码字符集。例如,“勺”、“刊”二字的全码均为“GDS”,将“刊”字挑选入二级简码字符集后,“刊”的二级简码为“GD”;“侦”、“货”二字的全码均为“/BBR”,将“侦”字挑选入二级简码字符集后,“侦”的二级简码为“/B”,将“货”字挑选入三级简码字符集,则“货”的三级简码为“/BB”;对国标GB2312中的汉字采用本发明技术后,汉字全码的重码数少于270个,重码字的简码数则更少,非专业汉字录入人员稍加记忆,便能熟练掌握简码。引入简码后,简码字的全码仍然保留。引入简码,能使单字输入的重码率降至1%以下。单字中部件、笔画的拆分原则是,(1)部件取大的原则——拆分出的部件包含尽可能多的笔画。(2)笔顺定序的原则——在两个以上部件交错排列时,部件的位次依其首笔画的位次而定。如,“柬”字应拆为木、口、丷的顺序。本发明的有益效果本发明用部件和笔画的代码组合来对绝大多数汉字进行编码,对少数汉字亦使用拼音首字母参与编码,对词组采用音形码和全形码两种编码方法,有效地发掘了音码和形码各自的优点,既符合人脑思维的习惯,又充分拓展了编码资源,使单字输入重码率大大降低。本发明涉及的汉字编码方案应用于国标GB2312中的全部汉字(偏旁部首除外)时,单字输入的重码率低于1%。本发明提供的中文输入键盘的键位体现了部件和笔画的音形特征,使编码规则实现了好学易记,有利于非专业汉字录入人员实现汉字键盘输入的高速盲打。权利要求1.本发明涉及一种汉字部件笔顺编码法及其输入键盘,其特征在于将汉字的笔画按形态分为点、横、竖、撇、捺、折、左钩、右钩、提共9种;将汉字的构字部件确定为230种;用26个英文字母(不分大小写)和“;”、“/”共28个符号作为汉字笔画和部件的代码,使部件和笔画映射到标准通用英文键盘的28个键盘位置上,从而将标准通用英文键盘改造成为中文输入键盘;将所有汉字按部件和笔画的笔顺关系划分成零部件类、一部件类、水平二部件类、垂直二部件类、二部件与独立笔画混合类、三部件类、三部件与独立笔画混合类、四部件及四部件以上类共八类。2.按照权利要求1,本发明确定的汉字部件及其键盘位置(代码)是A足匚冂凵B八白贝疒匕卜C寸川产虫厂丆D石大刀ク刂E儿耳二亠冫阝卩ヨF方夫非凡反分缶丰扌G广戈弋工弓古干甘艮宀勹H禾火户I氵灬J巨井加臼及几京戋钅K可癶L林立卢里立龙乐了纟M门马末米莫免毛母皿矛乜N女内廿牛O木口P疋彡目罒尸Q其七气千欠犬犭且R人如刃日彳S豕司山水十少身氏三手厶マ饣礻T土士田天屯冖U乌五艹廾V月乃巛巜W万王无瓦韦未丸攵X兄习夕心辛肖小忄乂ナ系统。通过光隔离器391接收的信号通知控制处理器356正在整个商店进行播叫。根据这种信息,在播叫过程中控制处理机356使音响系统305发出的声音调低。为了与播叫系统相连接控制处理器356通过中继器390输出。</p><p>该分布式音响系统是一70伏的使很多扬声器平行放置的系统。使用一变压器变换扬声器负载,由低阻抗负载变为高阻抗负载,当利用一能够驱动如在优选实施中所述按并行方式放置的20-25个扬声器时,所呈现的阻抗约1Kohm(千欧)。在扬声器中可以采用KenwoodKFC-1053驱动器和SoundolierHT-87变压器。KFC-1053的低频性能利用Thiele-Small参数来表征,这些参数是利用4′×4′助声板以及1.18升箱得到的阻抗曲线测得的,列表如下</tables>在扬声器中每个驱动器后面的腔体的体积是1.5升,形成的系统Q近于1。在优选实施例中,该箱与一个二阶高通滤波器结合工作,以便为系统提供第千阶高通滤波特性。综合在一起的滤波器和扬声器的截止频率低于3dB,低于截止频率的滑离变化比未加滤波器的箱更陡。这个滤波器在音响控制器310中以数字方式实现。</p><p>KFC-1053驱动器具有一塑料防尘罩以及一离心分离器状(Wbizzer)圆锥,有效辐射范围趋过10KHZ。这样能使声音具有一定时的“明亮度”,这正是在商店环境中所需要的。</p><p>在该优选实施例中,指定扬声器工作在70.7V的分布系统中。两个驱动器中的每一个都装有自身的变压器以及初级抽头选择开关。Sou-ndolierHT-87恒压变压器的技术数据列表如下应将口所包围的字符的尾画作为整字的尾画);三部件与独立笔画混合类(四位码)由第一部件代码、第二部件代码、第三部件代码、第一独立笔画代码按书写顺序组成一个四位码;四部件及四部件以上类(四位码)第一部件代码+第二部件代码+次尾部件代码+尾部件代码。5.按照权利要求1、2、3、4,对汉字词组的音形编码方法是,二字词(四位码)取两字的拼音首字母按字的先后顺序组成词的前两码,取两字的第一码按字的先后顺序组成词的后两码;三字词(四位码)取三个字的拼音首字母按字的先后顺序组成词的前三码,取第三字的第一码作为词的第四码;四字及四字以上的词(四位码)取第一、第二、第三、末尾字的拼音首字母组成词的四位码。6.按照权利要求1、2、3、4,对汉字词组的全形编码方法是,二字词(四位码)分别取两字的前两码按字的先后顺序组成词的四位码;三字词(四位码)分别取三个字的第一码组成词的前三码,取第三字的第二码作为词的第四码;四字及四字以上的词(四位码)取第一、第二、第三、末尾字的第一码组成词的四位码。7.按照权利要求1,分号“;”的输入方法为依次敲击“;”键和空格键;斜线“/”的输入方法为依次敲击“/”键和空格键。8.本发明还涉及一种重码字的简码技术,其特征是从每一组三位码和四位码的重码字中各挑选出一个汉字,取被挑选汉字的全码中的前两位码元组成该汉字的二位编码,对于二位编码相同的汉字,则舍弃使用频率相对较低的汉字的二位编码,与某些汉字的二位全码相同的二位编码也予以舍弃,从而以保留下来的二位编码字组成一个编码唯一的二级简码字符集;从每一组四位码的重码字中各挑选出一个未被选入二级简码字符集的汉字,取被挑选汉字的全码中的前三位码元组成该汉字的三位编码,舍弃与三位全码汉字的编码相同的三位编码字,也舍弃与其它三位编码字的编码相同而使用频率又相对较低的三位编码字,即形成一个编码唯一的三级简码字符集;重码字在被赋予二级简码或三级简码后,其全码仍然保留。全文摘要汉字部件笔顺编码法及其输入键盘属于中文信息处理
技术领域
。本发明确定了230种构字部件和9种笔画,根据部件和笔画的音形特点,把部件和笔画映射到标准通用英文键盘的28个键位上,主要使用部件和笔画的代码组字,分别用音形码方式和全形码方式组词,提供了一种重码率较低、好学易记的汉字编码法及其输入键盘,有利于非专业汉字录入人员实现汉字键盘输入的高速盲打。文档编号G06F3/023GK1157953SQ9611775公开日1997年8月27日申请日期1996年10月21日优先权日1996年10月21日发明者李建黎申请人:李建黎
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1