拼音汉字编码的制作方法

文档序号:6460328阅读:1617来源:国知局

专利名称::拼音汉字编码的制作方法拼音汉字编码
技术领域
在全面研究汉语拼音规律及汉语常用语素(词根)使用规律的基础上,产生二者最佳结合的拼音汉字编码。属汉字输入音码系列。
背景技术
:国家语委《2005年中国语言生活状况报告》调查平面媒体、有声媒体、网络媒体文本文件890多万个共9亿字次,其中汉字7亿多字次。上述三类媒体共用汉字5607个,但仅581个汉字就可以覆盖其中80%,2315个汉字可覆盖99%,一个人掌握1万多条词语,900多个汉字就可阅读90%的出版物。这些资料说明,汉语从用字形区分同音语素(比如创造越来越多的汉字),向用语音区分同音语素(更多的使用常用字组词)的方向发展,基本语素(词根)的作用越来越突出。《汉语拼音方案》所展示的汉语语音系统和2300多个常用字所代表的汉语基本语素(词根),是汉语的两大基础。本发明是以这套语音系统为基础,用最简洁的形式来准确标识汉语基本语素(词根),给2400多个汉语词根予拼音定型,基本实现--对应o
发明内容本发明作为一种电脑汉字输入的音码,主要优点在于构成编码的符号标准化、国际化、音素化,全由26个拉丁字母组成。编码所依赖的语音表达系统更简洁,更有规律。编码保留汉字意、音明确的构词单元特点,把汉字的声调、词性等重要特征引入编码中,使其在准确反映字音的同时对字意能有所提示。见码能读,见字知音能编码,编码规律简单,易学易记。这是用拉丁字母准确标识汉字的重要突破。本发明主要解决如下三方面的问题1、创造一种不依赖汉字字形,只依赖字音、词性的汉字输入编码;2、创造一种通讯中使用的可读性编码;3、减轻外国人学习汉语的难度,避开学习汉字,直接学习汉语,不依赖汉字也能准确表达汉语,用电脑处理汉字的读、写。本发明的技术方案包括拼音汉字编码韵母表,韵母变式,拼音汉字编码声调表示法及词性调符的使用。第一、《拼音汉字编码》方案1、《拼音汉字编码》声母表([]内为国际音标,与《汉语拼音》相同)b[b]P[P]m[m]f[f]d[d]t[tn[n]1[1]g[g]k[k]h[h]w[w]j[d3]q["x[4>]y[j]z[ts]c[ts']s[s]zh[t§]ch[ts'sh[f]r[zJ其中与英语发音区别较大的是q[U]x[4>]z[ts]c[ts']zh[t§]ch[ts']r[zt]每个声母只读一个音2、《拼音汉字编码》韵母表"拼音汉字编码"韵母表是本发明的重要发明成果之一,其示意图见图l,通过图1的韵母表,汉语韵母完全归结为七个单韵母及其变读组成的23个双韵母,称为30韵图。为了区别一些同音词根,还需要使用韵母变式。见图2.3、《拼音汉字编码》韵母与《汉语拼音》韵母对照表-"拼音汉字编码"韵母与汉语拼音韵母对照见图3,拼音汉字编码拼音规则与《汉语拼音》相同,声母发音轻短,韵母重读。4、声调的表示——词性调符汉语词根中,大多数是名词、动词、形容词三类,词性都比较明显,如果在字形上能有所反映,对于区别同音语素,表达词意将大有帮助。本方案用k作为名词调符,r作为动词调符,v作为形容词调符,(这三个字母经过各声调的筛选,在汉语的拼音中最不容易混淆),就可以既标调又表示词性。调符在拼音时不发音。拼音汉字编码表示声调、词性方法见图4,图4为本发明重要成果之一。5、拼音汉字编码定型举例使用拼音汉字编码方法根据词性及声调对汉字进行拼音定型举例见图5.下面列举一些有代表性的拼音汉字编码caik菜草dda打d已v大rdiu丢kdom冬f肌r方夂rfei飞f犯法vdo多shatau少goo果gwnk罐hran寒haau好ten看rnryu描kwiv快vpyn偏pynr骗p:ra爬kqym枪qqym抢guiv虫贝yur遇挖wka娃mmai买脆ir卖讲rjum捐寻qvom穷6、高频常用字采用特殊定型-zh这sh是o我d的mey没he和i一bw不wey为词缀字1儿z子7、其它词根它们包括某些副词、方位词、语气词、量词、助词、介词、连词等不用调符。需要标调时可用","例阴平ma阳平,ma上声m,a去声ma,8、数词、方位词不用调符,采用韵母变式定型-如soan三soi四bay百deom东nosn南sho柳上xoa下9、单纯词和连绵词整体定型.-举例lindim伶仃yautyu窈窕paihwi徘徊duzhwn杜撰comcom匆匆wubi务必xynshem先生sh6nni6什么bijim必竞soyi所以laji垃圾zhuyi主义xyutyu萧条pempai澎湃comrotn从容fambyn方便kanke坎坷cenci参差goudam勾当jilym伎俩tyujyn条件biram必然yimgai应该mahu马虎hutu糊涂pembo蓬勃10、基本定型字组词像汉字一样,两个基本定型字联写在一起可组成词如dda打rkai开组成ddarkai打开wenr问tki题组成訓rtki问题dik地dauk道组成dikdauk地道区别dikdauk是复合词表示地下通道。didau是整体定型词,表示真正的,纯粹的。由于汉语常用重叠式组词,如"自","己"意思差不多,重叠组成词"自己",类似的有:干净、平安、快捷、检查、学习、讨论、休息、打击等。在组词时,其中一个字就可以词缀化。分别为(横线部分为词缀)kwiv.jydda.ji.j.jynchattyuxin挑衅ggaig^改革zi.]iiganjoinvpvimanxrue^iittaulonrxiwxi也有基本定型字直接加词缀组词的。如2ixiv仔细rhui^挥霍vhuihwn辉煌xumliv绚丽jiyyam给养zzhishi指示许多非常用(因而也不定型)字都作为词缀处理。整体定型词也有词缀化的情况。如yuzhou(宇宙)是整体定型词。在迎hram(宇航)中被词缀化为yu。yizham(仪仗)yishi(仪式)是整体定型词在Xlbyyu(仪表)yiqoik(仪器)xirkeom(仪容)Yitaik(仪态)loiiii(礼仪)中被词缀化为yi。jihui(机会)是整体定型词。在^iiyur(机遇)vweyji(危机)shkoiii(时机)zzhwni(转机)中被词缀化为ji。jigwn(机关)是整体定型词。在jigour(机构)jitii(机体)yyouji(有机)iiqoik(机器)iinren(机能)中被词缀化为ji。上述两种情况的词缀ji的词源不同。jimji(经济)是整体定型词。在cka;i.jim(财经)jimykim(经营)中被词缀化为jinu11、应用举例hvanxumyyu寒宣语niihaau!你好!zaauchkenhaau!早晨好!0shZhanHw.我是张华niidxynshemhaauraaktahenhaau,xyrxyr.waanoantaitai.jinktynktynqihenhaauzaijynr.yyoukomvlraiwranl.单字(词)你的先生好吗?他很好,谢谢。晚安太太。今天天气很好。再见。有空来玩。nii你xynshem先生ktynqi天气h犯u好kta他.zai再早hen很jynr见chken晨xyr谢yyou有0我vm3n晚komw空sh是osn安lrai来d的teitai太太玩(儿)ma吗jinktyn今天hv肌xum寒宣yyu语vzhenzhenvdchwmrvxinwamwamrchuyuouran,bimqyduixynvyyouzhixukgourchemmeemlydttyuzhanr,dandeemjivzonvbeidrgewnnynhevzonzhomvxynvyyouzhixukdchrwntoom,wamwamddauzhirsiweishoamdxreunkguiddaujuu,ggaibynrzhixysorxuyaurdyuumbwzzhipandavdyanrjuiyuvswnr.第二、《拼音汉字编码》对汉字的整理1、汉字中的多音(因而也多义)字在《拼音汉字编码》中完全被分开了。广vpau(形)如?fijpauk(名)Lpaur(动)rd肌k(名)弹〗一Ltran(动)「hai(副)hrwn(动)vgan(形)gani:(动)gank(名)发行还干倒{2、有些一音多义字也被分开了,lii(名)lli(动)gTO(畐lj)rg怖(名)如关核rfa(动)fak(名)xrim(动)hkam(名)rbei(动)beik(名)frem(动)femk(名)dauv(形)daau(形)gwwn(名)ggwn(动)hkoe(名)hroe(动)hui(副)gank(名)felhuik(名)干"Cganr(动)-j-buk(名)上^sham,(方位词)布丄bur(动)丄shamr(动)3、有一些实在无法分离的重音字,只好按重码处理。如jur聚、据jeur拒、惧juk句、炬b露办、扮bo證拌、泮......据统计,汉字常用字中多音(因而多义)字占16.7%,加上一音多义字,多义字比例还会更大,而《拼音汉字编码》无多音字(这对外国人学习汉语大有好处),编码2452个,重码169个,重码率6.9%。重码时,按字的常用、单用频率由高到低排列,考虑到2315个常用字使用频率占99%,非单用字是按词组输入,实际操作碰到的重码字很少。图1是设计的拼音汉字编码韵母表。图2是韵母变式的表示方法表。图3是拼音汉字编码设计的韵母与汉语拼音韵母对照表,其中省去了韵母ia、jia、qia、xia写成ja、qa、xa。不再使用非标准字母U。(类似情况等同处理)图4是拼音汉字编码表示声调、词性的方法示意表。图5是拼音汉字编码定型的举例。具体实施方案1、用电脑键盘直接输入编码,键盘表示无须改动。2、注意整体定型词,要整词作为一个编码输入。3、由于常用字、单用字都经由编码输入,已解决99%的汉字输入问题(按实际使用字计算,不是按所有汉字计算),其余通过组词输入解决。4、对于地名、人名等需要单独输入非常用、非单用字时,可使用类似"汉语拼音输入法"的查找选字方式输入。权利要求1.《拼音汉字编码》韵母表(30韵图)把汉语韵母归结为a、o、e、i、y、u、w7个单韵母系列包括它们的鼻音变读,u变读,i变读及其表示方法。(其中与《汉语拼音方案》相同的不在权利要求之内)拼音汉字编码韵母表<tablesid="tabl0001"num="0001">id="icf0001"file="S2008100582308C00011.gif"wi="154"he="67"top="48"left="32"img-content="drawing"img-format="tif"orientation="portrait"inline="no"/></tables>2.韵母变式的表示方法韵母变式表<image>imageseeoriginaldocumentpage2</image>3、拼音汉字编码表示声调、词性的方法,包括用k、r、v做名词、动词、形容词调符,以及调符位置表示声调的方法,特别是上声调采用双写声母(或韵母)的表示方法。<table>tableseeoriginaldocumentpage3</column></row><table>4、副词、语气词、量词、助词、介词等用","的标调方式。举例阴平ma阳平,ma上声m,a去声ma,5、高频常用字的特殊编码方式zh这,sh是,o我,d的,没mey,he和,i一,bw不,wey为,词缀字z子,l儿。6、利用权利要求l、2、3、4、5给汉字常用词根的编码方式。举例caik菜,hoo火,yyou有,kanr看,guiv贵,jjim讲,xrun寻,yaur要。7、用此种编码进行中文信息处理,用此种编码进行汉字输入电脑、手机等其它使用编码的系统。8、使用此种编码进行教学、出版文字、音像等出版物,用此种编码在网络上使用。9、用此种编码进行通讯、编制密码。全文摘要拼音汉字编码发明属电脑输入汉字编码中的音码序列。在电脑输入汉字编码中,创造一种不依赖汉字字形,只依赖字音、词性的汉字输入可续性编码。本发明在“汉语拼音方案”的基础上建立了符合汉语规律的简洁的语音系统,把汉字的声调、词性等重要特征引入编码中,给汉语常用词根定型,并在组词输入中解决非常用、非单用字的输入问题。本发明主要用于汉字输入电脑、手机等各种电子系统,以及通讯密码的编制。本发明还可用于对外汉语教学,帮助外国人避开较难的汉字学习直接学习汉语,用电脑来读写汉字。文档编号G06F3/023GK101266521SQ200810058230公开日2008年9月17日申请日期2008年3月28日优先权日2008年3月28日发明者严鲁生申请人:严鲁生
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1