拼音数字国际码的制作方法

文档序号:6460417阅读:164来源:国知局

专利名称::拼音数字国际码的制作方法拼音数字国际码本发明创造了一种"拼音数字国际码"(1)并以此理论建立了"拼音数字国际码数字[据]库"(5)对于"国际中文、西文、文字、语言的数字化编码"(2),见说明书附图,它有"拼音数字国际码、数字码的[十进制]数制"(3),以自然数、整数的1、2、3、4.....的阿拉伯数字编码,及"拼音数字国际码、数字码的[二进制]数制"(4),见说明书附图中的表1-1、表1-2、表1-3、表4-1,其中表1-1是中文汉语拼音数字编码,有字母26个,数字编码从01到26;表1-2是俄语字母数字编码,有字母33个,数字编码从01到33;表1-3是英文字母数字编码,有字母26个,数字编码从01到26,由于中文文字的汉语拼音用的是英文字母的书写形式,其字母数字编码完全相同,故中文的数字编码用"中文版"标识,英文的数字编码用"英文版"来标识,以版本的不同来区分文版的不同,进行数字编码及语言译义,有"中文[汉语拼音]数字编码的[中文版]"(33)和"英文[英文字母]数字编码的[英文版]"(34),表4-l是世界语字母数字编码,世界语有字母28个,数字编码从01到28。由于电子计算机采用的是开关电路,即0与1的断和通开关两种形式,故"拼音数字国际码"(1)是两种数字编码形式即"拼音数字国际码数字码的[十进制]数制"(3)和"拼音数字国际码、数字码[二进制]数制"(4)。对于国际文字语言的数字化编码即"国际文字、语言[]国文字[字母化]数字编码系统"(17),如中国的汉语文字,它的文字特征是一种"非字母化文字",中文汉字是一种"模块化文字",汉字有"口"字旁、"之"字旁等对于中文汉语文字的"数字化编码"很困难,国际"字母化文字"语言如英语、世界语、俄语等可采用"国际文字、语言[]国文字[字母化]数字编码系统"(17)表l-l、1-2、1-3、4-1,非字母化文字语言如汉语可采用国际文字语言()国文字数字化编码。中国王永明教授发明的"五笔字型输入法"打字,以书名"五笔字型字词典"为例,中文出版社、化工出版社,该"五笔字型字词典"中共有中文汉字等7136个,如五笔字型输入法打中文汉字"郊"字,它可以打"uibh"打出"郊"字,也可以用"ugbh"打出"郊"字,用汉语拼音两种方法打出的同一个中文汉字的称为重码,即"中国汉语[五笔字型输入打字法]重码"(35),五笔字型字词典中共有重码的文字个数为2477个汉字,将五笔字型字词典中重码中文汉字2477个汉字去除五笔字型字词典中的全数中文汉字共7136个汉字,即"中国汉语[五笔字型输入打字法]重码率"(36),其重码率是2477/7136为34.7113%,以五笔字型输入法打字,由于重码率为34.7113%,即3分之1的比率,三个中文字就有一个以上的中文汉字为重码,将其数字编码化的实施,中文汉字"新华字典"用汉字拼音26个英文字母书写法进行数字化编制,这个数字编码即如同英语,因"新华字典"中的汉语拼音专用的是英语字母即"新华字典"中共有8701个汉字的数字编码。中文国际文字语言有着保留、同化、变异、消亡共四种形式,即为"国际[]国文字语言保留式"(6),"国际[]国文字语言同化式"(7),"国际[]国文字语言变异式"(8),及"国际[]国文字语言消亡式"(9)这四种形式。对于国际部分西方文字语言来讲,采用的是字母化文字,可以进入"国际文字、语言、数字化编码的排版系统"(53),利用国际文字语言互译的机译系统,即"国际文字、语言、数字化编码、互译的计算机系统"(54)进行国际文字语言计算机的机译系统,文字语言数字化互译工作,建立了"国际文字、语言[]国文字、语言的理科A版"(31),为国际文字、语言的"一词一意",和"国际文字、语言[]国文字、语言的文科B版"(32)国际文字、语言的"一词多意"。对于"国际文字、语言[]国文字、语言[模块化]数字编码系统"(18)而言,我们怎样将国际文字语言中的非字母化文字语言即"模块化"文字语言变为国际文字语言的"数字化编码"。我们知道,国际上任何[]国的[]语均有发音即每个国际文字均有文字的"音"、"形"、"意"。例如"音"为文字发音,"形"为文字结构及书写方式,"意"为该字或词的文化意译有"字译"、"音译"与"意译"三种形式,这是"国际文字、语言[]国文字的'音,、'形,、'意,的三要素"(49)可以转变为"国际文字、语言[]国文字的'数字化编码'、'意'的二要素"(51)。中国的汉语文字语言是一种模块化形式,这种模块化文字变为字母化文字就是靠该发明的"拼音数字国际码"(1)来解决,将如同"中文汉字"的"拼音数字化"是"国际文字、语言[]国文字、语言[模块化文字一数字化编码]转换模"(21)。将"新华字典"的中文汉字的"汉语拼音"进行数字化编码,可进行"数字化打字","数字化排版","数字化互译"工作。将国际语言的字母数字化编码即得"国际文字、语言[]国文字的'音'、'形'二要素转换为数字化编码一要素的[模]"(50)。中文汉语的使用人群有13亿个人数,其学习中文汉字的人数名列世界第一,是占全球50亿人口的四分之一。英语是国际上的第一语言,是"联合国[会议笔译]和[同声传译]的正式用语"(13)。英、法、俄、汉、西班牙、阿拉伯共六国是"国际文字、语言共六国[]国的第一语言群"(14)。有"国际文字、语言共一八五国[]国的第二语言群"(15),有"国际文字、语言[]国文字、语言分布区[域]块"(16),如"世界语"是印欧语系,分布区[域]块是在印度及欧洲,将"国际文字、语言进行"数字化编码"即得"国际文字、语言[]国文字、语言[字母化]数字编码系统"(17),将其国际文字、语言的字母数字化就得到"国际文字、语言[]国文字、语言[字母一数字化]模式"(19),如同中文汉语是一种"模块化文字",我们将其"新华字典"中的中文汉字以"汉语拼音"数字化编码,就得到"国际文字、语言[]国文字、语言[模块一数字化]模式"(20),有"国际文字、语言A-B[-]两国,直译系统"(22)及"国际文字、语言第一语言群的六国A-B[-]两国、直译系统"(25),"国际文字、语言第二语言群的一八五国A-B[-]两国、直译系统"(26)及"国际文字、语言第一、第二语言群六国与一八五国互译的A-B[-]两国、直译系统"(27)。以及"国际文字、语言A-B-C[--]三国、间译系统"(23),有"国际文字、语言A-B-C[--]三国,间译系统的B[]国、中介语"(24)及"国际文字、语言、第一语言群、六国A-B-C[--]的间译系统"(28)及"国际文字、语言、第二语言群、一八五国A-B-C[--]三国的间译系统"(29)及"国际文字、语言第一、二语言群六国与一八五国互译A-B-C[--]三国的间译系统"(30),为区分西文字、词、句,用"拼音数字国际码、西文、字标/"(10),"拼音数字国际码、西文、词标〃"(11),"拼音数字国际码、西文、句标〃/"(12)来区分,"国际文字、语言[]国[文字一字母数字化]编码"(46)是国际文字、语言字母数字化编码,"国际文字、语言[]国[文字一模块文字的数字化转换]编码"(47)是用"汉语拼音"进行"模块化文字"的数字化编码,将国际文字、语言的模块化文字进行"数字化编码"转换成"国际文字、语言[]国文字模块一字母[数字化转换模]编码"(48)。"国际数字化通信理论"(37)是将国际文字、语言进行"数字化编码",文字语言的"数字化编码"后的通信方式,其数字通信方式有"明码通信"(38)和"暗码通信"(39)两种,如"男教师在中国",其"明码通信"(38)的通信数字编码为14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15。其"暗码通信"(39),有"日期输入法[一]"(40)、"手机号输入法[一]"(41)、"自然数输入法[_]"(42)、"有理数输入法[—]"(43)、"无理数输入法[—]"(44)、"奇、偶数输入法[一]"(45)。以"日期输入法[一]"(40)为例,同样"男教师在中国",如这天是2007年12月30日,以八个数字码为单位,他们分别加2、0、0、7、1、2、3、0,从第九个数字码始,仍是分别加2、0、0、7、1、2、3、0,以此原理每八位数字为单位循环编码。故"14+2、01+0、14+0,10+7、09+1、01+2、15+3,19+0、08+2、09+0,26+0、01+7、09+1,26+2、08+3、15+0、14+2、07+0,07+0、21+7、15+1",即得出16、01、14,17、10、03、18,19、10、09,26、08、10,28、11、15、16、07,07、28、16这是"暗码通信"(39)的"日期输入法"[2007.12.30-8](40)。再如"暗码通信"(39)的"手机号输入法[—]"(41),如手机号(42)是13858078153共十一位数字,同样以"男教师在中国"为例,其"暗码通信"(39)的"手机号输入法[13858078153—11]"(41)其"明码通信"(38)的通信数字编码为14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15,他们分别加l、3、8、5、8、0、7、8、1、5、3H^—个数字,其"暗码通信"(39)的"手机号输入法[13858078153—11]"(41)是"14+1、01+3、14+8,10+5、09+8、01+0、15+7,19+8、08+1、09+5,26+3、01+1、09+3,26+8、08+5、15+8、14+0、07+7,07+8、21+1、15+5",即得出15、04、22,15、17、01、22,27、09、14,29、02、12,34、13、23、14、14,15、22、20以此原理每i^一位数字为单位循环编码。"暗码通信"(39)用"自然数输入法[—]"(42),如用"自然数输入法[1、2、3、4—4]"(42)时,同样以"男教师在中国"为例,其"明码通信"(38)是14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15,其"暗码通信"(39)的自然数输入法[1、2、3、4—4]"(42)那么它们分别下数字14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15各加1、2、3、4各加4个数字作为一个循环,得14+1、01+2、14+3,10+4、09+1、01+2、15+3,19+4、08+1、09+2,26+3、01+4、09+1,26+2、08+3、15+4、14+1、07+2,07+3、21+4、15+1,并以此四个数字一循环,得出15、03、17,14、10、03、18,23、09、11,29、05、10,28、11、19、15、09,10、厶d、丄Uo"暗码通信"(39)用"有理数数输入法[—]"(42)时,可用如黄金分割数a/b^/c,b二a^的比例中项,b^.618作为暗码,则四个数作为一组循环数,同样以"男教师在中国"为例,其"明码通信"(38)是14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15,其"有理数数输入法"(42)那么它们分别将以下数字14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15各加0、6、1、8各加4个数字作为一个循环,得:14+0、01+6、14+1,10+8、09+0、01+6、15+1,19+8、08+0、09+6,26+1、01+8、09+0,26+6、08+1、15+8、14+0、07+6,07+1、21+8、15+0,并以此四个数字一循环,得出14、07、15,18、09、07、16,27、08、15,27、09、09,32、09、23、14、13,08、29、15。"暗码通信"(39)用"无理数数输入法[一]"(43)时,可用无理数"圆周率n"、"根号2gW5"、"对数log3,,、"自然数为底的对数e=2.71828"。用"无理数输入法[一]"(44)时,如"无理数输入法e[2.71828—6]"(44),得其"明码通信"(38)是14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15,其"暗码通信"(39)的无理数输入法e[2.71828—6],,(44),得加2.712828这6个数字为一'循环,即14+2、01+7、14+1,10+8、09+2、01+8、15+2,19+7、08+1、09+8,26+2、01+8、09+2,26+7、08+1、15+8、14+2、07+8,07+2、21+7、15+1,则"无理数输入法e[2.71828—6]"(44)得16、08、15,18、11、09、17,26、09、17,28、09、11,33、09、23、16、15,09、28、16。"奇、偶数输入法[3、4一2]"(45),或"奇、偶数输入法[1、2—2]"(45),以"奇、偶数输入法[1、2—2]"(45)为例,仍足汉语"男教师在中国",得其"明码通信"(38)是14、01、14,10、09、01、15,19、08、09,26、01、09,26、08、15、14、07,07、21、15,分别加1、2两个数字作为一个循环,14+1、01+2、1'1+1,10+2、09+1、01+2、15+1,19+2、08+1、09+2,26+1、01+2、09+1,26+2、08+1、15+2、14十1、07+2,07+1、21+2、15+1,得"奇、偶数数输入法[1、2—2]"(45)的暗码15、03、15,12、10、03、16,21、09、11,27、03、10,28、09、17、15、09,08、23、16。"拼音数字国际码"(1)可进行"国际数字化打字"、"国际文字、语言、数字化编码的排版系统"(53)和"国际文字、语H、数字化编码、互译的计算机系统"(54)进行中、西文间的互译工作。在"说明书"屮表1是汉语"拼音数字中国码"的数字编码表表2是俄语"拼音数字国际码"的数字编码表表3是英语"拼音数字国际码"的数字编码表表4是英语、俄语、中文(中介语)语言互译的"拼音数字国际码"。表5是汉语、英语、俄语频度数理分析表表6是世界语数字编码表表7有"拼音数字国际码"的西文、字标、词标、句标的数字编码表表8是王永明"五笔字型输入法"的中文汉字"模块化文字"字根、结构表表9是拼音数字国际码发明专利索引表"说明书"的图面说明表1是"汉语拼音"数字编码表,汉语拼音采用英语字母,共26个字母,数字编码01-26。表2是"俄语字母"数字编码表,俄语共33个字母,数字编码01-33。表3是"英文字母"数字编码表,英语共26个字母,数字编码01-26。表4是英语、俄语、中文(中介语)语言互译的拼音数字国际码①"页码"是所对应的字、词典中文字、词所对应的页数。②数字码是"拼咅数字国际码"字母所对应的数字编码。③中文、俄文、英文是该国文字、词组的字、词表示。④中文的四位拼音数字码,"新华字典"中共有8701个汉字,该字的自然排列数字编码,如"阿"字在新华字典第1页的总计第1位,"阿"字四位数字编码为0001,"爱"字在新华字典第3页的总计36位,"爱"字的四位数字编码为0036,"做"字在新华字典第666页的最后一位总计8701位,"做"字的四位数字编码为8701,同样该表中的"男"字在新华字典的348贞,总计4510位,"男"卞的四位数字编码为4510,"教"字在新华字典的227页,总计2902位,"教字的四位数字编码为2902。⑤七位拼音数字码(中国)第1、2位是汉语拼音的图1数字编码数,第3、4位及5、6、7位是该汉字在新华字典中的拼音数字编码。表5是汉语、英语、俄语频度数理分析农。是汉语、炎语、俄语三种语言各首位拼音(中文)首位字母(西文)字词典的页数,占字、词典中总页数的比例,两者相除得到的频度表。表6是世界语数字编码表,世界语有28个字母,故数字编码为01-28。表7是西文以"世界语"为例的数字编码,有字标、词标、句标的句子,如"男教师在屮国"数字码以世界语的一句话中进行西文世界语数字码分段,西文"字标"是西文每个字后的标示,"词标"是西文每个词后的标示,西文"句标"是西文每句话结束后的句后标示,对中文、西文的数字编码文字进行字、词、句的标示区分。如"男教师在中园"这"男教师"是词,后有词标,"在"是字,后有字标,"中国"是词,后有词标。"男教师在中国"这句语已结束,为此"中国"这词后即有词标,又有句标。表8是王永明"五笔输入法"中文汉字字根结构表,图8中共有249个字根,表明中文的汉字是"模块化文字"。249个字根设入26个"汉语拼音"的26个字键其中。表9是拼音数字国际码发明专利索引表,共3页,该表中对于"拼音数字国际码"发明专利文件中54个发明
专利名称:的编号、专利文件代码、范例进行例表,便于统-一检索。汉语"拼音数字中国码"与英语、俄语的数字编码表汉语拼音表,<table>tableseeoriginaldocumentpage15</column></row><table>英语、俄语、中文(中介语)语言互译的"拼音数字国际码表4<table>tableseeoriginaldocumentpage16</column></row><table>注①"新华字典"此"汉语字典"的统一书号ISBN7-10O-O3974"6/H991(2005.7第10版)②"精选俄汉(汉俄)词典",此"双解词典"统一书号ISBN7-10(M)0507-8/H180(1994.8第—版)③)"精选英汉(汉英)词典",此"双解词典"统一书号ISBN7-100-03933-9/H,983(2004.10第一版)汉语、英语、俄语频度数理分析表表5<table>tableseeoriginaldocumentpage17</column></row><table>汉语"拼音数字中国码"与世界语*数字编码表世界语字母表6<table>tableseeoriginaldocumentpage18</column></row><table>汉语与世界语、世界语数字编码有"拼音数字国际码"西文字标、词标、句标的数字编码表7<table>tableseeoriginaldocumentpage18</column></row><table>*世界语世界语是由波兰柴l'j霍夫博士(L丄.Zamenhof)1887年在印、欧语系的基础上创立的-"种国际辅助语。^永喊长《$型祸^玄的、tt、',f獲4A^t't依、化^泉<table>tableseeoriginaldocumentpage19</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table>拼脔数字翻际码发明专利索引表表9<table>tableseeoriginaldocumentpage21</column></row><table>拼裔数字闺际码发明专利索引表表9<table>tableseeoriginaldocumentpage22</column></row><table>权利要求1、本发明是一种“拼音数字国际码”(1)。2、如同权利要求书1所述的"拼音数字国际码"(1)。它的特征是:将"国际、中文、西文文字语言的数字化编码"(2),建立了拼音数字国际码数字[据]库(5)。有"拼音数字国际码、数字码的[十进制]数制"(3)及"拼音数字国际码、数字码的[二进制]数制"(4)。3、如同权利要求书1所述的"拼音数字国际码"(l)。它的特征是将"国际文字、语言[]国文字的"音"、"形"、"意"三要素"(49)转化为"国际文字、语言[]国文字的"数字化编码"、"意"的二要素"(51)。4、如,权利要求书1所述的"拼音数字国际码"(l)。它的特征是将如同中文汉语的"模块化文字"通过"新华字典"汉语拼音进行数字化编码,可将"模块化文字"转化为"数字化编码"。是"国际文字、语言[]国文字的"音"、"形"二要素转换为数字化编码一要素的[模]"(50)。5、如同权利要求书1所述的"拼音数字国际码"(l)。它的特征是有"拼音数字国际码、西文、字标/"(10)、"拼音数字国际码、西文、词标//"(11)、"拼音数字国际码、西文、句标/〃"(12),将中、西文的字、词、句间的"国际中文、西文、文字、语言的数字化编码"(2)加以区分。6、如同权利要求书1所述的"拼音数字国际码"(l)。它的特征是:开拓了"国际数字化通信理论"(37),其数字通信方式,有"明码通信"(38)和"暗码通信"(39)两种。其"暗码通信"(39)有"国际数字化通信——日期输入法[一]暗码"(40)、"国际数字化通信——手机号输入法[一]暗码"(41)、"国际数字化通信——自然数输入法[一]暗码"(42)、"国际数字化通信一一有理数输入法[—]暗码"(43)、"国际数字化通信——无理数输入法[一]暗码"(44)、"国际数字化通信——奇、偶数输入法[—]日音码"(45)。7、如同权利要求书1所述的"拼音数字国际码"(l)。它的特征是有"国际文字、语言A—B[—俩国、直译系统"(22)和"国际文字、语言A—B—C[--]三国、间译系统"(23)。8、如同权利要求书1所述的"拼音数字国际码"(l)。它的特征是有"国际文字、语言[]国文字、语言的理科A版"(31)国际文字、语言的"一词一意"和"国际文字、语言[]国文字、语言的文科B版"(32)国际文字、语言的"一词多意"的两个版本。9、如同权利要求书1所述的"拼音数字国际码"(l)。它的特征是可进行"数字化打字"和"国际文字、语言、数字化编码的排版系统"(53)和"国际文字、语言、数字化编码、互译的计算机系统"(54)。全文摘要本发明1.创造了拼音数字国际码理论,将各国文字数字化编码,建立数据库。2.国际文字语言有音、形、意三要素,转为数字码和词意二要素。3.对数字码的各国文字,用字标、词标、句标将中、西文的字、词、句加以标示。4.中文汉字是模块化文字,有249个字根,用汉语拼音将中文汉字转为数字化编码。5.三国间语言文字互译的中介语,需简明的语法,单一的词意,目前各国文字不符合要求。中文的语法极简单,文字结构又极复杂,采用数字化编码,中、西文结合中文可作中介语。6.建立了国际数字化通信理论,数字通信有明码通信和暗码通信。7.有国际文字①数字化编码打字,②计算机数字化排版,③各国语言文字数字化互译功能。文档编号G06F17/20GK101526850SQ200810059980公开日2009年9月9日申请日期2008年3月5日优先权日2008年3月5日发明者仇家仪申请人:仇家仪
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1