汉字基元音托编码输入法的制作方法

文档序号:6571927阅读:182来源:国知局
专利名称:汉字基元音托编码输入法的制作方法
所属领域本发明涉及一种汉字基元音托编码输入方法,确切地说,涉及一种以构成汉字的基本元素(简称基元)为基础,以汉字规范部件为主导的汉字编码输入方法。本发明的编码元素是构成汉字的十个基本元素字音的声母,故名音托。该汉字基元音托输入方法特别适用于电话通信领域里利用十个字母键输入汉字,直接进行汉字短语通信;同时也可以在普通计算机的键盘上输入汉字,以及用其进行汉字检索等,属于汉字编码技术领域。
背景技术
现在,人类社会已经进入信息时代,通信业务在全球普遍获得了高速发展,其中能够满足人们快节奏工作和生活、人员流动性强需求的移动通信更是突飞猛进。先进的移动电话不仅具有通话功能,而且还能够传输数据、上互联网收发信息;而在中国数据通信是不可能离开汉字信息处理的。例如,GSM和第三代数字移动电话都能够显示汉字,具有短消息服务功能的移动电话机可以接收和显示汉字短语信息。如果可以直接利用移动电话机完成汉字输入,就可以方便地向对方发送汉字短消息,拓宽移动电话机的用途,使其成为一种携带方便、使用灵活的多媒体终端。然而,目前,移动电话的短消息大都是以西文发送的,这对于习惯使用汉字的中国人无疑是极不方便。因此,如何实现移动电话机的短消息通信的中文化已经成为当今通信技术的一个研发热点,而中文化的关键是要解决如何利用电话机的十个数字键完成汉字的输入。申请人在对汉字作了大量研究的基础上,提出一种《汉字数字编码输入法》的发明专利申请(专利申请号96106763.2,公开号CN1144356A)。之后,国家有关部门对汉字的基本笔画和部件作了规范,并制定了《现代汉语通用字笔顺规范》和GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》,使汉字编码的基本笔画和部件构成有了统一的规范标准,也为汉字编码的标准化和规范化提供了衡量的基准。

发明内容
本发明的目的是提供一种以构成汉字的基本元素为基础、以规范部件为主导的汉字基元音托编码输入方法,该方法是依据国家规范的汉字笔顺和部件编制的;是一种只要提供十个字母键位,就能够规范、方便、简单地输入汉字的汉字编码输入方法,而且,可以根据本发明的编码输入法开发出具有中国特色的电话终端和信息家电设备。
本发明的另一目的是提供一种以构成汉字的基本元素为基础、以规范部件为主导的汉字基元音托编码输入方法,该方法也可用于检索汉字,且比用原来的部首查字方法更加方便快捷。由于本发明部件的选取、汉字的拆分和笔顺、笔画均符合国家语言文字的规范,与中小学的识字教育相一致,所以,该方法还可用于中小学的汉字识字教育,为普及义务教育和提高教育质量作出贡献。
本发明的再一目的是提供一种以构成汉字的基本元素为基础、以规范部件为主导的汉字基元音托编码输入方法,使用该方法,可以在移动电话机或其他电话机、台式或笔记本式计算机、或掌上型电脑的十个键位的键盘上输入汉字,从而使上述各设备实现小型化、便携化、袋装化、乃至微型化。
本发明的汉字基元音托编码输入方法是这样实现的其包括有下列步骤(一)首先将组成汉字的各部件分成两部分基本笔画(即基元)和一般部件,并将每个笔画和部件用相应名称读音的声母表示之;其中基元共有十种,分别用一位字母H、S、P、D、I、K、T、B、V、J作为其编码的代码(下称代码),称为一码部件;其余的一般部件则都用两位字母作为其代码,称为两码部件;(二)基元及其代码(1)选取汉字的五个基本笔画横(一)、竖(丨)、撇(丿)、点(丶)、折(乙),分别用其声母H、S、P、D、I(代表ZH)、作为其代码;(2)选取五个组字能力强的部件口(口)、提手(扌)、八(八)、十(十)、京字头(亠)分别用其声母K、T、B、V(代表SH)、J作为其编码的代码,并以上述十个部件作为构成汉字的基本元素(简称基元);(3)将一些与上述十个汉字的基元在形状上有相同或相似的笔画或部件,或含义相近又有亲缘关系的部件也归入上述各基元;具体分类情况列表如下 (三)除去上述基元以外的其他规范部件都作为一般部件,即为两码部件,其代码表示方法如下(1)按照书写顺序,取该规范部件的第一笔画(或第一基元),并根据上述第(二)步骤中基元的代码表示方法的规定,将该基元的声母符号作为该部件的第一位代码;(2)按照书写顺序,取该规范部件的第二笔画(或第二基元),并根据上述第(二)步骤中基元的代码表示方法的规定,将该基元的声母符号作为该部件的第二位代码;
(3)以上述第一位代码的声母作为行号,第二位代码的声母作为列号,列出相应的各个一般部件的汉字编码的代码矩阵表,该汉字基元音托部件矩阵表的具体分类情况如下 上述各个部件的行列号字母就是该一般部件的两位基元音托的代码;(四)利用电话机、或计算机、或其他装置键盘上的十个键位分别代表上述编码规则中的各个声母代码;(五)进行汉字击键输入,其规则是按照汉字的书写顺序,依次取码,逐个击键输入;其中(1)合体汉字按书写顺序取第一、第二和最末部件,上述各部件组合的代码即为该汉字的编码;(2)独体汉字按书写顺序取第一、第二和最末基本笔画(一、丨、丿、丶、乙),上述各笔画组合的代码即为该汉字的编码。
该编码输入方法的击键次数是不相等的最少的击键一次,其中大部分汉字击键2-5次,最多的需要击键六次。
在编码输入的汉字击完该汉字的编码时,要击空隔键表示结束该汉字的输入。
在编码输入汉字出现重码时,应根据屏幕的提示,敲击相应的数字键进行选择。
当汉字的字符集容量大时(如按GB13000.1字符集建立字库时),可以对汉字取四个基本笔画(或基元)编码击键,即分别取第一个、第二个、第三个和最末个基本笔画(或基元)编码击键输入。
该编码输入方法的击键次数最多时需要击键八次。
该编码输入方法对高频汉字采用1位码长的方式,以提高输入效率。
本发明的汉字基元音托编码输入法是汉字输入方式的又一创新之举,它的推广应用将会使计算机和通信设备的中文化产生一个重大突破。其主要特点是1、科学根据汉字是由笔画构成部件、由部件组成汉字的构成规律,本发明的基元音托法就是以优选出来的构成汉字的十个基本元素为基础,以这十个基本元素的声母字母作为代码,又将汉字的各规范部件都用基元音托的声母字母作为其代码,再用基元音托化的各个规范部件对汉字进行编码输入,从而使汉字编码这个多年以来一直困扰人们的复杂问题得到简单化和条理化。本发明的编码规则简单清晰,记忆容易,处理方便。2、规范本发明所采用的各个部件都是完全遵照国家语言文字工作委员会近年颁布的GF3001-1997《信息处理用GB13000.1汉字部件规范》确定的,其中的笔顺依据则是《现代汉语通用字笔顺规范》。所以,本发明的汉字基元音托编码输入方法是依据构成汉字的基本元素和规范部件作为基础而制定的,本发明对汉字的笔顺、部件的规定和拆分都符合国家规范的汉字拆分原则。3、设备小型化现在,由于微电子和集成电路技术的迅猛发展,掌上型电脑已经进入市场,移动电话机则已袋装化、袖珍化,这样,输入键盘的大小就成为通信设备小型化、微型化的关键。本发明采用十个键位的汉字编码输入方法为各种电脑或通信设备的小型化、微型化提供了条件和方便。
本发明是申请人在96年7月5日申请的发明专利《汉字数字编码输入法》(申请号96106763.2)的基础上的改进,也是上述专利申请的最新版本;两者属于同一发明构思和技术体系。不同之处在于前者的基元是用数字作为代码,而后者的基元是用音托声母的字母作为代码。
下面结合附图和汉字编码的实例详细说明本发明的汉字编码输入方法


图1是本发明的汉字十个基元(即笔画)及基本部件的音托声母的字母代码表。
图2是本发明的汉字基元音托声母的字母代码行列矩阵表。
具体实施例方式
本发明对汉字进行编码的方法是以基元为基础的,基元共有十个,其中五个是基本笔画(一、丨、丿、丶、乙),另五个是组字能力强的部件(口、扌、八、十、亠)。图1通过列表描述了如何对十个基元利用其音托声母的字母作为其代码。图2则是根据本发明的编码方法将有关部门颁布的规范部件,经合理归并而绘制的一个行列矩阵示意图,它清晰表明了每个规范部件的代码。现举例介绍如下首先将汉字的规范部件分成两部分基元和一般部件,其中基元共有十种,分别用H、S、P、D、I、K、T、B、V、J字符表示,为一码部件,其中H、S、P、D、I、分别表示汉字基本笔画“横”(一)、“竖”(丨)、“撇”(丿)、“点”(丶)、“折”(乙)的声母;K、T、B、V、J则分别表示组字能力强的规范部件口(口)、提手(扌)、八(八)、十(十)、京字头(亠)的声母。本发明是以上述十个声母音托的字母或代码作为汉字编码的基本元素(简称基元)。其助记口诀是横H竖S撇为P,点D折I方口K,提手T八B十V,点下一横京头J。
本发明对各个部件在图2的行列矩阵表中的排列位置也是有规律可循的,即凡是起笔为“一”(横)的部件都排在第1行(H)的右侧,例如,“示”、“工”、“石”、“车”、“王”;凡是“丨”(竖)起笔的部件都排在第2行(S)的右侧,例如,“止”、“业”、“卜”、“贝”、“小”。同理,凡是起笔为“丿”(撇)的部件都排在第3行(P)右侧;起笔为“丶”(点)的部件排在第4行(D)右侧;起笔为“乙”(折)的部件排在第5行(I)右侧;起笔为“口”字形的排在第6行(K)右侧;起笔为“扌”(提手)的排在第7行(T)右侧;起笔为“八”(八)字形的排在第8行(B)右侧;起笔为两笔交叉十字形的排在第9行(V)右侧;起笔为“亠”京字头的部件则都排在第10行(J)的右侧,例如,“言”、“广”、“方”、“立”、“文”。
每个规范部件的第二笔笔画(或基元)则是其所在位置的列号,例如,部件“止”第二笔是横,代码为H,那么,“止”的第二位代码在H列,其代码为H;部件“业”第二笔是竖,代码为S,那么,“业”的第二位代码在S列,其代码为S;部件“中”第二笔是折,代码为I,那么,“中”的第二位代码在I列,其代码为I。上述“示”、“工”、“石”、“车”等部件的第二位代码就分别是H、S、P、I。加上其第一位代码“H”,上述各部件的代码則分别为HH、HS、HP、和HI。依此类推,不一一列举。总之,每个部件的行列号就是该部件的代码。需要说明的是,本发明的列号只有九个,其中“亠”京字头只会出现在第一笔,不会在第二笔部件中出现,故省略之。
本发明方法的另一特点是将一些与上述十个汉字的基元在形状上有相同或相似的笔画或部件,或含义相近又有亲缘关系的笔画或部件也归入上述基元里。如,“丨”(竖)行里,除去“竖”的基本笔画(基元)外,将部件“亅”(竖钩)如“小”、“水”等字的第一笔,归并其中,用同一字母“S”作为其代码。在“丶”点)行里,除去“点”的基本笔画“丶”外,将部件“”(捺)如“不”、“水”等字的最末笔,归类其中,用同一字母“D”作为其代码。在“乙”(折)行里,包括有“乛”、“フ”(横折),“乚”、“”(竖折)和“乙”、(连续折)等,如“力”、“乃”等的第一笔,归并其中,用同一字母“I”作为其代码。在“口(口)”行里,将按书写顺序四周封闭的方形结构,如“国”、“田”等的第一个部件归并其中,用同一字母“K”作为其代码。在“扌”(提手)行里,除去“提手”外,将竖向有两个以上交点的部件,如“”、 、“丰”、 “戈” 等归并其中,用同一字母“T”作为其代码。又如在“八(八)”行里,除去“八”外,将八字形结构的部件,如“人”、“入”、“丷”等归并其中,用字母“B”作为其代码。在“十(十)”行里,除去“十”外,将有一个交点的部件,如“七、” “义”、“ナ”、“九”等归并其中,用同一字母“V”作为其代码。
除了上述基元以外的其他部件都称为一般部件,使用两位字母作为其代码,又称两码部件。本发明将两码部件和基元合并在一起,并按照其起笔笔画(或部件)相同的,排在同一行里。例如部件“长”、“片”、“斤”、“兆”、“儿”、“白”、“牛”、“采”、“千”等起笔均为“撇”,则把这些部件都和“撇”放在同一行里,用字母“P”作为其第一位代码。再将除去第一部件(或笔画)之外的第二部件(或笔画)也按照上述基元的代码规律放入该行列矩阵表里的同一列里。则上述部件“长”、“片”、“斤”、“兆”、“儿”、“白”、“牛”、“采”、“千”的编码代码分别是PH、PS、PP、PD、PI、PK、PT、PB、PV。又例如部件“彡”、“舟”、“斤”、“爪”、“瓜”等部件的第一笔画和第二笔画都是“撇”,则上述这些部件的代码应该都是“PP”。再如“金”、“羊”、



四个部件,其起笔画(部件)是“人”和“八”,属于同一基元范围,代码为“B”;去掉基元“人”和“八”,剩下的第二笔画又都是“横”,其代码为“H”,所以,上述四个部件的两位代码为“BH”,在图2中的位置也是“BH”。依此类推,可将全部约560多个的规范部件分别归纳到图2所示的10×9行列矩阵表中。而且,每个部件在图2行列矩阵表中的位置,也就是该部件的代码。由于按照上述原则取码时,有的行列位置并无对应的部件列入其中,则该坐标位置的代码即为空白。
需要指出的是图2所示的各部件代码行列矩阵表,规律性很强,易学好记,几乎没有多少需要死记硬背的地方,符合人们认知识字的习惯。因此,本发明是汉字输入方式的又一创新之举。
本发明进行击键输入汉字的顺序过程就是按照该汉字的书写顺序,将每个汉字先分为若干个基本笔画(基元)或部件,并根据上述编码规则分别对各个笔画或部件依次取码,顺序逐个击键输入。通常,每个汉字最多取三个部件(或基元),即第一、第二和最末的三个部件(或基元)。当然,如果字符集容量较大时(例如,按BG13000.1字符集建立字库时),也可以对每个汉字取四个部件(或基元),即以第一、第二、第三和最末的四个部件(或基元)进行编码。
现以“汉字部件编码法”七个字的基元音托编码举例如下


有些汉字拆分后的部件多于三个,按规则也只取第一、第二、最末三个部件,其余都舍去。例如“蹰”可拆分为“口”、

、“厂”、“一”、“口”、“”、“寸”共七个部件,根据规则只取“口”、

和“寸”三个部件,其余的部件(“厂”“一”、“口”、“”)则都舍弃,所以“蹰”的编码为KSHVD。
使用本发明的方法进行字母代码输入的击键次数,每个汉字是不相等的有的汉字击键最少,只有一次,例如“一”编码为H,码长为一位;最多则取三个部件代码击键,即分别取第一个、第二个和最末个部件代码击键,最多需要击键六次;如“篡”编码为PHKHVD。此时的最长编码是6位。但是,当汉字的字符集容量大时(如按GB13000.1字符集建立字库时),本发明也可以对汉字取四个基本笔画(或基元)编码击键,即分别取第一个、第二个、第三个和最末个基本笔画(或基元)编码击键输入。取四个部件时,最长的码长为8位。在编码输入的汉字击完该汉字的编码时,要击空隔键表示结束该汉字的输入。采用本发明输入汉字时,绝大多数汉字的码长都在2-5位之间。该编码输入方法对高频汉字采用1位码长的方式,以提高输入效率。
本发明除了用于GSM、CDMA数字移动电话开发非话电信业务外,还可以用于掌上电脑、PDA等小键盘的其他通信或计算机设备的键录输入,也可以应用于汉字检索及辞书编纂、电子字典查字等领域。
权利要求
1.一种以构成汉字基本元素为基础,以规范部件为主导的汉字基元音托编码输入法,其特征在于其包括有下列步骤(一)首先将组成汉字的各部件分成两部分基本笔画(即基元)和一般部件,并将每个笔画和部件用相应名称读音的声母表示之;其中基元共有十种,分别用一位字母H、S、P、D、I、K、T、B、V、J作为其编码的代码(下称代码),称为一码部件;其余的一般部件则都用两位字母作为其代码,称为两码部件;(二)基元及其代码(1)选取汉字的五个基本笔画横(一)、竖(丨)、撇(丿)、点(、)、折(乙),分别用其声母H、S、P、D、I(代表ZH)、作为其代码;(2)选取五个组字能力强的部件口(口)、提手(扌)、八(八)、十(十)、京字头(亠)分别用其声母K、T、B、V(代表SH)、J作为其代码,并以上述十个部件作为构成汉字的基本元素(简称基元);(3)将一些与上述十个汉字的基元在形状上有相同或相似的笔画或部件,或含义相近又有亲缘关系的部件也归入上述各基元;具体分类情况列表如下 (三)除去上述基元以外的其他规范部件都作为一般部件,即为两码部件,其代码表示方法如下(1)按照书写顺序,取该规范部件的第一笔画(或第一基元),并根据上述第(二)步骤中基元的代码表示方法的规定,将该基元的声母符号作为该部件的第一位代码;(2)按照书写顺序,取该规范部件的第二笔画(或第二基元),并根据上述第(二)步骤中基元的代码表示方法的规定,将该基元的声母符号作为该部件的第二位代码(3)以上述第一位代码的声母作为行号,第二位代码的声母作为列号,列出相应的各个一般部件的汉字编码的代码矩阵表,该汉字基元音托部件矩阵表的具体分类情况如下 上述各个部件的行列号字母就是该一般部件的两位基元音托的代码;(四)利用电话机、或计算机、或其他装置键盘上的十个键位分别代表上述取码规则中的各个声母;(五)进行汉字击键输入,其规则是按照汉字的书写顺序,依次取码,逐个击键输入;其中(1)合体汉字按书写顺序取第一、第二和最末部件,上述各部件组合的代码即为该汉字的编码;(2)独体汉字按书写顺序取第一、第二和最末基本笔画(一、丨、丿、丶、乙),上述各笔画组合的代码即为该汉字的编码。
2.根据权利要求1所述的汉字基元音托编码输入法,其特征在于该编码输入方法的击键次数是不相等的最少的击键一次,其中大部分汉字击键2-5次,最多的需要击键六次。
3.根据权利要求1所述的汉字基元音托编码输入法,其特征在于在编码输入的汉字击完该汉字的编码时,要击空隔键表示结束该汉字的输入。
4.根据权利要求1所述的汉字基元音托编码输入法,其特征在于在编码输入汉字出现重码时,应根据屏幕的提示,敲击相应的数字键进行选择。
5.根据权利要求1所述的汉字基元音托编码输入法,其特征在于当汉字的字符集容量大时,可以对汉字取四个基本笔画(或基元)编码击键,即分别取第一个、第二个、第三个和最末个基本笔画(或基元)编码击键输入。
6.根据权利要求5所述的汉字基元音托编码输入法,其特征在于该编码输入方法的击键次数最多时需要击键八次。
7.根据权利要求1或3或5所述的汉字基元音托编码输入法,其特征在于该编码输入方法对高频汉字采用1位码长的方式,以提高输入效率。
全文摘要
一种汉字基元音托编码输入法,是选取构成汉字的十个基本元素为基础,以这十个基元名称的声母的一个字母作为其代码,其它部件用其首笔笔画(基元)和第二笔笔画(基元)的两个字母表示其代码。编码时按书写顺序取第一、第二和最末三个部件,这些部件代码的组合即为该汉字的编码。对于不能拆分的汉字编码时按书写顺序取第一、第二和最末三个基本笔画,这些笔画代码的组合即为该汉字的编码。本发明是申请人的发明专利申请96106763.2的最新版本,其编码规则简单明了,记忆量少,符合认知识字习惯,能够方便、快捷、简单地输入汉字,特别适用于电话通信领域输入汉字,直接进行汉字短语通信;也可在普通计算机的键盘上输入汉字;还可用于汉字检索和教学。
文档编号G06F3/023GK1336581SQ01141929
公开日2002年2月20日 申请日期2001年9月24日 优先权日2001年9月24日
发明者肖金卯, 武云翠, 肖敏飞, 肖敏鹏 申请人:肖金卯
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1