用于大字符集汉字含非规范笔画与字音标识代码的输入法的制作方法

文档序号:7851118阅读:169来源:国知局
专利名称:用于大字符集汉字含非规范笔画与字音标识代码的输入法的制作方法
技术领域
本发明涉及用于将所要处理数据转变为计算机能处理的形式的信息编码,尤其涉及一种用于大字符集汉字含非规范笔画与字音标识代码的输入法。
背景技术
现有中文移动电话机所配用的汉字笔画、拼音输入方式都是仅针对不包括繁体汉字且只有六千多个汉字的GB2312字符集的汉字输入,与其配套的《汉字笔画编码及对应字表》的汉字笔画编码,只是依据国家主管部门规范的笔画笔顺,与其配套的《拼、注音字母、字母串及对应字表》的每个拼、注音字母、字母串对应字,也不必判断简体有效字音、繁体有效字音、字音的有效声调以及常用字、不常用字。为适应中文移动电话机的汉字信息交换所涉及的汉字范围不断的扩大的需要,有必要在中文移动电话机上统一配置含有繁体汉字的GB13000.1等大字符集的汉字字库以及配备相应的港、台中文手移动电话机用户都可以使用的汉字笔画、拼音和注音输入方式。但是,汉字笔画输入方式会有部分汉字的港、台地区惯用字形与中文移动电话机上的GB标准的规范字形存在差异以及同一个字形的港、台地区惯用笔画笔顺与规范笔画笔顺有所不同的问题。例如汉字“今”的规范笔画笔顺是撇-点-点-折,而港台惯用字形的笔画笔顺是撇-点-横-折;汉字“非”的规范笔画笔顺是竖-横-横-横-竖-横-横-横,而港台惯用字形的笔画笔顺是撇-横-横-横-竖-横-横-横;汉字“方”的规范笔画笔顺是点-横-折-撇,而港台惯用笔画笔顺是点-横-撇-折。如果相应汉字笔画输入软件所采用的《汉字笔画编码及对应字表》只是以规范笔画即中文移动电话机上的GB标准的规范字形和规范笔画笔顺作为汉字笔画编码的依据,不仅港台地区的中文移动电话机用户难以使用,而且针对笔画笔顺容错的汉字也存在不易操作的问题;如果将非规范的港台笔画即港台地区惯用字形的笔画笔顺和非规范的容错笔画即同一个字形的港台地区惯用笔画笔顺和容错笔画笔顺也作为汉字笔画编码的依据,而又未配备相应可识别的非规范笔画笔顺的数据信息,就必然会存在同一个汉字的非规范的港台笔画、非规范的容错笔画与规范笔画混淆不清的问体,不利于汉字字形的统一规范化以及汉字笔画的规范化推行。而汉字拼、注音输入方式会存在有部分拼、注音字母、字母串对应字需要标示简体有效字音、繁体有效字音的问题。例如汉字“儿”,对应于拼、注音字母串“er、儿”的“儿”是简体字,对应于拼、注音字母串“ren、ㄖㄅ”的“儿”则没有简、繁体之分;汉字“乾”,对应于拼、注音字母串“qian、ㄑ丨ㄢ”的“乾”没有简、繁体之分,对应于拼、注音字母串“gan、巜ㄢ”的“乾”则是繁体字;汉字“宁”,对应于拼、注音字母串“zhu、ㄓㄨ”的“宁”是繁体字,对应于拼、注音字母串“ning、ㄋ丨ㄥ”的“宁”则是简体字。如果针对GB13000.1大字符集中汉字输入,汉字拼、注音输入软件所配套的《拼、注音字母、字母串及对应字表》不能提供判断部分拼、注音字母、字母串对应字的简体有、无效字音,繁体有、无效字音的相应标示,存在无法满足汉字字音输入规范化的要求。然而,以上问题至今尚未见有实用化的解决方案。

发明内容
本发明所要解决的一个技术问题是弥补现有技术的缺陷,提出一种用于大字符集汉字含非规范笔画标识代码的输入法。
本发明所要解决的另一个技术问题是弥补现有技术的缺陷,提出一种用于大字符集汉字含字音标识代码的输入法。
本发明的一个技术问题是这样加以解决的这种用于大字符集汉字含非规范笔画标识代码的输入法,包括采用汉字笔画输入方式配套的《汉字笔画编码及对应字表》。
这种用于大字符集汉字含非规范笔画标识代码的输入法的特点是设有由港台笔画编码字标示、容错笔画编码字标示,以及同一个字的非规范笔画编码与规范笔画编码出现不同的起始码位标示所构成的非规范笔画标识。
本发明的一个技术问题是这样进一步加以解决的
在相应《汉字笔画编码及对应字表》中的港台笔画编码字、容错笔画编码字的前或后,配备两位非规范笔画标识代码,一位是港台笔画编码字标示、容错笔画编码字标示,另一位是同一个字的港台笔画编码、容错笔画编码与规范笔画编码出现不同的起始码位标示。中文移动电话机采用的汉字笔画输入软件通过所述标识代码获取相应的数据信息,以解决现有汉字笔画输入方式输入GB13000.1大字符集汉字存在的问题。
依据四位二进制数与十六进制数的对应关系,所述两位非规范笔画标识代码采用单字节方式编码。
所述两位非规范笔画标识代码是十六进制数字0~9、A~E、F组成。
所述非规范笔画标识代码的一种取码关系是所述港台笔画编码字标示的第一位代码,是十六进制数字0~9、A~E、F中的一个;所述容错笔画编码字标示的第一位代码,是十六进制数字0~9、A~E、F中与港台笔画编码字标示相同的一个或另一个;所述同一个字的非规范笔画编码与规范笔画编码出现不同的起始码位1~15的标示的第二位代码,依次是十六进制数字0~9、A~E的一个。
所述非规范笔画标识代码的另一种取码关系是所述同一个字的非规范笔画编码与规范笔画编码出现不同的起始码位1~15的标示的第一位代码,依次是十六进制数字0~9、A~E的一个;所述港台笔画编码字标示的第二位代码,是十六进制数字0~9、A~E中的一个;所述容错笔画编码字标示的第二位代码,是十六进制数字0~9、A~E中与港台笔画编码字标示相同的一个或另一个。
本发明的另一个技术问题是这样加以解决的这种用于大字符集汉字含字音标识代码的输入法,包括采用汉字拼、注音输入方式配套的《汉字拼、注音字母、字母串及对应字表》。
这种用于大字符集汉字含字音标识代码的输入法的特点是设有由简体有、无效字音标示,繁体有、无效字音标示,常用、非常用字标示,阴平、阳平、上声、去声、轻声声调的有、无效标示所构成的字音标识。
本发明的另一个技术问题是这样进一步加以解决的在相应《汉字拼、注音字母、字母串及对应字表》的每个拼、注音字母、字母串对应字的前或后,配备八位字音标识代码,八位分别对应于简体有无效字音、繁体有无效字音、常用非常用字、阴平声调有无效、阳平声调有无效、上声声调有无效、去声声调有无效、轻声声调有无效标示。中文移动电话机采用的汉字拼、注音输入软件通过所述字音标识代码获取相应的数据信息,以解决现有汉字拼、注音输入方式输入GB13000.1大字符集汉字存在的问题。
所述八位字音标识代码采用单字节方式编码。
所述八位字音标识代码由数字0或1组成。
所述字音标识代码的取码关系是所述简体有无效字音标示是八位代码中一位的数字0或1;所述繁体有无效字音标示是八位代码中其余七位中的一位的数字0或1;所述常用非常用字标示是八位代码中其余六位中的一位的数字0或1;所述阴平声调有无效标示是八位代码中其余五位中的一位的数字0或1;所述阳平声调有无效标示是八位代码中其余四位中的一位的数字0或1;所述上声声调有无效标示是八位代码中其余三位中的一位的数字0或1;所述去声声调有无效标示是八位代码中其余二位中的一位的数字0或1;所述轻声声调有无效标示是八位代码中其余一位的数字0或1。
本发明与现有技术对比的优点与效果是,有效地解决了与现有相应汉字笔画输入方式配套的《汉字笔画编码及对应字表》的汉字笔画编码,将非规范的港台笔画即港台地区惯用字形的笔画笔顺和非规范的容错笔画即同一个字形的港台地区惯用笔画笔顺和容错笔画笔顺与规范笔画都作为汉字笔画编码的依据,所存在的使同一个汉字的非规范笔画与规范笔画混淆不清的问题,有利于汉字字形的统一规范化以及汉字笔画的规范化推行。还有效地解决了现有汉字拼、注音输入方式用于输入GB13000.1大字符集中汉字,存在与其配套的《拼、注音字母、字母串及对应字表》不能提供判断部分拼、注音字母、字母串对应字的简体有、无效字音,繁体有、无效字音的相应标示所存在的无法满足汉字字音输入规范化要求的问题,有利于提高现有汉字拼、注音输入方式的操作性能。
具体实施例方式
下面结合具体实施方式
对本发明作进一步详细的说明具体实施方式
一本具体实施方式
是一种用于大字符集汉字含非规范笔画标识代码的输入法。配套《汉字笔画编码及对应字表》的汉字笔画编码,以单一的汉字笔画代码作为码元,汉字笔画横、竖、撇、点、折的代码,分别对应是数字1、2、3、4、5。依照所述笔画标识代码的取码关系,将十六进制数字6、7分别对应作为港台笔画编码字、容错笔画编码字的标识代码。
例如(1)汉字“今”规范笔画是撇-点-点-折,规范笔画编码是3445;港台笔画是撇-点-横-折,港台笔画编码是3415;港台笔画编码与规范笔画编码出现不同的起始码位是第三位。
依照本发明非规范笔画标识代码的一种取码关系,港台笔画编码字“今”的非规范笔画标识代码是十六进制数字63;依照本发明非规范笔画标识代码的另一种取码关系,港台笔画编码字“今”的非规范笔画标识代码是十六进制数字36。
(2)汉字“非”规范笔画是竖-横-横-横-竖-横-横-横,规范笔画编码是21112111;港台笔画是撇-横-横-横-竖-横-横-横,港台笔画编码是31112111;港台笔画编码与规范笔画编码出现不同的起始码位是第一位。
依照本发明非规范笔画标识代码的一种取码关系,港台笔画编码字“非”的非规范笔画标识代码是十六进制数字61;依照本发明非规范笔画标识代码的另一种取码关系,港台笔画编码字“非”的非规范笔画标识代码是十六进制数字16。
(3)汉字“方”规范笔画是点-横-折-撇,规范笔画编码是4153;容错笔画是点-横-撇-折,容错笔画编码是4135;容错笔画编码与规范笔画编码出现不同的起始码位是第三位。
依照本发明非规范笔画标识代码的一种取码关系,容错笔画编码字“方”的非规范笔画标识代码是十六进制数字73;依照本发明非规范笔画标识代码的另一种取码关系,容错笔画编码字“方”的非规范笔画标识代码是十六进制数字37。
具体实施例方式
二本具体实施方式
是一种用于大字符集汉字含字音标识代码的输入法。
依照所述字音标识代码的取码关系,将八位代码中右起第八位的数字1、0分别对应作为简体有效字音标示、简体无效字音标示;将八位代码中右起第七位的数字1、0分别对应作为繁体有效字音标示、繁体无效字音标示;将八位代码中右起第六位的数字1、0分别对应作为常用字标示、非常用字标示;将八位代码中右起第五位的数字1、0分别对应作为阴平声调有效标示、阴平声调无效标示;将八位代码中右起第四位的数字1、0分别对应作阳平声调有效标示、阳平声调无效标示;将八位代码中右起第三位的数字1、0分别对应作为上声声调有效标示、上声声调无效标示;将八位代码中右起第二位的数字1、0分别对应作为去声声调有效标示、去声声调无效标示;将八位代码中右起第一位的数字1、0分别对应作为轻声声调有效标示、轻声声调无效标示;
例如1、汉字“儿”对应于拼、注音字母串“ren、ㄖㄅ”的“儿”,不分简繁体,即是简体有效字音、繁体有效字音;是非常用字;声调是阳平,即是阴平声调无效、阳平声调有效、上声声调无效、去声声调无效、轻声声调无效。
依照本发明字音标识代码的取码关系,其字音附加信息代码是11001000。
对应于拼、注音字母串“er、儿”的“儿”,是简体字,即是简体有效字音、繁体无效字音;是常用字;声调是阳平,即是阴平声调无效、阳平声调有效、上声声调无效、去声声调无效、轻声声调无效。
依照本发明字音标识代码的取码关系,其字音附加信息代码是10101000。
2、汉字“乾”对应于拼、注音字母串“gan、巜ㄢ”的“乾”,是繁体字,即是简体无效字音、繁体有效字音;是常用字;有效声调是阴平,即是阴平声调有效、阳平声调无效、上声声调无效、去声声调无效、轻声声调无效。
依照本发明字音标识代码的取码关系,其字音附加信息代码是01110000。
对应于“qian、ㄑ丨ㄢ”的“乾”,不分简繁体,即是简体有效字音、繁体有效字音;是常用字;有效声调是阳平,即是阴平声调无效、阳平声调有效、上声声调无效、去声声调无效、轻声声调无效。
依照本发明字音标识代码的取码关系,其字音附加信息代码是11101000。
3、汉字“宁”对应于拼、注音字母串“zhu、ㄓㄨ”的“宁”,是繁体字,即是简体无效字音、繁体有效字音;是非常用字;有效声调是去声,即是阴平声调无效、阳平声调无效、上声声调无效、去声声调有效、轻声声调无效。
依照本发明字音标识代码的取码关系,其字音附加信息代码是01000010。
对应于拼、注音字母串“ning、ㄋ丨ㄥ”的“宁”,是简体字,即是简体有效字音、繁体无效字音;是常用字;有效声调是阳平、去声,即是阴平声调无效、阳平声调有效、上声声调无效、去声声调有效、轻声声调无效。
依照本发明字音标识代码的取码关系,其字音附加信息代码是10101010。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明由所提交的权利要求书确定的专利保护范围。
权利要求
1.一种用于大字符集汉字含非规范笔画标识代码的输入法,包括采用汉字笔画输入方式配套的《汉字笔画编码及对应字表》,其特征在于设有由港台笔画编码字标示、容错笔画编码字标示,以及同一个字的非规范笔画编码与规范笔画编码出现不同的起始码位标示所构成的非规范笔画标识。
2.如权利要求1所述的用于大字符集汉字含非规范笔画标识代码的输入法,其特征在于在相应《汉字笔画编码及对应字表》中的港台笔画编码字、容错笔画编码字的前或后,配备两位非规范笔画标识代码,一位是港台笔画编码字标示、容错笔画编码字标示,另一位是同一个字的港台笔画编码、容错笔画编码与规范笔画编码出现不同的起始码位标示。
3.如权利要求1或2所述的用于大字符集汉字含非规范笔画标识代码的输入法,其特征在于所述两位非规范笔画标识代码采用单字节方式编码。
4.如权利要求3所述的用于大字符集汉字含非规范笔画标识代码的输入法,其特征在于所述两位非规范笔画标识代码由十六进制数字0~9、A~E、F组成。
5.如权利要求4所述的用于大字符集汉字含非规范笔画标识代码的输入法,其特征在于所述非规范笔画标识代码的一种取码关系是所述港台笔画编码字标示的第一位代码,是十六进制数字0~9、A~E、F中的一个;所述容错笔画编码字标示的第一位代码,是十六进制数字0~9、A~E、F中与港台笔画编码字标示相同的一个或另一个;所述同一个字的非规范笔画编码与规范笔画编码出现不同的起始码位1~15的标示的第二位代码,依次是十六进制数字0~9、A~E的一个;所述非规范笔画标识代码的另一种取码关系是所述同一个字的非规范笔画编码与规范笔画编码出现不同的起始码位1~15的标示的第一位代码,依次是十六进制数字0~9、A~E的一个;所述港台笔画编码字标示的第二位代码,是十六进制数字0~9、A~E中的一个;所述容错笔画编码字标示的第二位代码,是十六进制数字0~9、A~E中与港台笔画编码字标示相同的一个或另一个。
6.一种用于大字符集汉字含字音标识代码的输入法,包括采用汉字拼、注音输入方式配套的《汉字拼、注音字母、字母串及对应字表》,其特征在于设有由简体有、无效字音标示,繁体有、无效字音标示,常用、非常用字标示,阴平、阳平、上声、去声、轻声声调的有、无效标示所构成的字音标识。
7.如权利要求6所述的用于大字符集汉字含字音标识代码的输入法,其特征在于在相应《汉字拼、注音字母、字母串及对应字表》的每个拼、注音字母、字母串对应字的前或后,配备八位字音标识代码,八位分别对应于简体有无效字音、繁体有无效字音、常用非常用字、阴平声调有无效、阳平声调有无效、上声声调有无效、去声声调有无效、轻声声调有无效标示。
8.如权利要求7所述的用于大字符集汉字含字音标识代码的输入法,其特征在于所述八位字音标识代码采用单字节方式编码。
9.如权利要求8所述的用于大字符集汉字含字音标识代码的输入法,其特征在于所述八位字音标识代码由数字0或1组成。
10.如权利要求9所述的用于大字符集汉字含字音标识代码的输入法,其特征在于所述字音标识代码的取码关系是所述简体有无效字音标示是八位代码中一位的数字0或1;所述繁体有无效字音标示是八位代码中其余七位中的一位的数字0或1;所述常用非常用字标示是八位代码中其余六位中的一位的数字0或1;所述阴平声调有无效标示是八位代码中其余五位中的一位的数字0或1;所述阳平声调有无效标示是八位代码中其余四位中的一位的数字0或1;所述上声声调有无效标示是八位代码中其余三位中的一位的数字0或1;所述去声声调有无效标示是八位代码中其余二位中的一位的数字0或1;所述轻声声调有无效标示是八位代码中其余一位的数字0或1。
全文摘要
本发明公开了一种用于大字符集汉字含非规范笔画与字音标识代码的输入法,其特征是在相应《汉字笔画编码及对应字表》中的港台笔画编码字、容错笔画编码字的前或后,配备两位非规范笔画标识代码,一位是港台笔画编码字标示、容错笔画编码字标示,另一位是同一个字的港台笔画编码、容错笔画编码与规范笔画编码出现不同的起始码位标示;在《汉字拼、注音字母、字母串及对应字表》的每个拼、注音字母、字母串对应字的前或后,配备八位字音标识代码,八位分别对应于简繁体有无效字音,常用非常用字,阴平、阳平、上声、去声、轻声声调有无效标示。有效地解决了同一个汉字的非规范笔画与规范笔画混淆不清,以及无法满足汉字字音输入规范化要求的问题。
文档编号H04M1/23GK1746830SQ20051011681
公开日2006年3月15日 申请日期2005年10月31日 优先权日2005年10月31日
发明者罗蒙明 申请人:罗蒙明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1