汉字拼音语言文字编码方法及其键盘的制作方法

文档序号:6604866阅读:423来源:国知局

专利名称::汉字拼音语言文字编码方法及其键盘的制作方法
技术领域
:本发明涉及汉字拼音语言文字编码方法,简称为汉音语编码,它可以用于计算机实现汉字的输入方法和实现其输入方法的键盘。众所周知,汉字最为突出的特点是有声调,能在字义上区别同音词和同音语素,并具有表义的功能。其次是偏旁部首为代表和区别象形文字的最根本的要素。检索可知,申请号为97112834.0,公开号CN1172982A名称为汉字全拼写编码及部首编码方法的发明专利公开的内容介绍,对声调与韵母的结合以加五个固定代码来实现。对韵母代码用无规律条理的一码或二码或三码代替,对字形主要以笔划为字根进行汉字编码,对字根的确定都是唯一地固定在一个键位上,缺少动态感及须死记硬背,记忆强度大,易丢易忘,对拼音的表达是分开各取韵母、声调,缺乏对拼音的声、韵、调及整体内在联系规律的统一表达。本发明的目的是提供一种可拼、可读、可写、可进行文字学习交流的、易学、易用的汉字拼音语言文字的编码方法及键盘。本发明的技术内容如下将文字转变为英文字母后,依据字根的确立规则并依照字根表选取字根代码,依据韵母声调表选取拼音码,然后将其输入到常用的键位上,以此构成的对汉字进行输入的键盘。其编码方法为取汉字的声、韵、调为拼音,取其根和形为字的区别要素,两要素的组成就构成了具有表音表义功能的汉字拼音语言编码。特别是此语言编码也可把拼音、字根独立出来,形成表音的拼音码和表形的字根汉字编码。即它们可分,可合成音形结合的汉音语码,纯拼音的拼音码及表形的以字根为主的汉字字元码。符合GB2312-80《信息交换用汉字编码字符集(基本集)》中的规定汉字。1.汉音语码单字无重码,但依规则需记住约122个同声同旁或同根的常用字复根和变异韵母汉字编码及其一些冷僻字,常用词组重码约140个。2.拼音码单字有重码,词组几乎无重码。3.字元码单字重码有82对(其中一级重码有7对),词组约为198对。优于五笔(单字246对,其中一级重码有58对,词组205对)等其它形码录入方案。本汉字拼音语言文字编码方法对会读不会写,会写不会读的人都可进行汉字编码输入。即不用为了学习音码。形码而学习两种不同的编码输入方法,真正做到一码在手走天下,而且我国是一个幅员辽阔,多方言的国家,对推广普通话,纠正汉语南腔北调的方言,起到了规范,统一的作用,无论从小学到中学,到走向社会,专业的还是非专业的人员,都可以随心所欲,任意取舍,使汉字进入到电脑时代与社会同步。对外国人认识和学习汉字更容易接受和理解。本发明规则少,规律性强,记忆量少,易学易用,重码少并解决了汉字的一字多音,一音多字的表达问题及其通篇文章的一次置换问题。成为码同字,字同码的语言文字编码。以下将结合附表对本发明作进一步的描述。表1为本发明的正、副根及其并列根表。表2为本发明的韵母声调表。表3为本发明的字根表。表4为本发明的音元及其复取表。表5为本发明依编码规则在汉字中出现的拼音元。表6为本发明的键盘上字母所对应的字根图。字根的确定规则1.确立159个偏旁、部首(大多数为单字),它们是代表每个汉字根本要素,称为字根。汉字中无明显字根的称为零根,用″o″表示。即共有160个字根。但字根有的并不规范,而有所变异,称为并列字根和副根(见表1)。根据汉字的结构可分为(1).左右结构(包括左.中.右结构)。(2).上下结构(包括上.中.下结构)。(3).内外结构(包括全包围.半包围结构)。(4).复合结构(多数为″o″根)。(5).独体字。2.每个汉字的字根确定的总规则是先上后下,先左后右,先外后内。(1).在左中右结构和上中下结构中,取根时有字义的,先归字义(常见为先,冷僻为后),后取字义外的独立根。(字根相互交接的按规则取根)如鸺---休.鸟.取鸟根螽---冬.虫.取虫根罴---罢.灬.取灬根淋---氵.林.取氵根巷---共.巳.取巳根蕉---艹.焦.取艹根字根相互交接的如克---十竞---立竟---立(2).在左.中.右结构中,如果左右字根相同,则以中间字根为先。在上.中.下结构中,如果上下字根相同,则以上字根为先。如辩---讠粥---米器---口卡---尜---小(3).在左.中.右结构中,如果前后都可组成常见字义或冷僻字义时,按规则取根(即左根为先)。如滩---氵树---木在上.中.下结构中,如果上下都可组成常见字义时,下根为先。都为冷僻字时,上根为先。如惫---心3.单根为先,重根为后。正根为先,副根为后。如婪---女禁---示岛---山畿---幺4、″卜″根在双字元中为正根,在多字元中为负根。如卤---卜桌---木5.以″莫.麻.″为字头的取底根,底根无字根的取″o″根。如劳---力莹---王魔---鬼麻---o靡---o寒---o搴---手幕---巾莫---o暮---日6.复合字根和常见字不易取根的见如下册.高.商.尚.离.典.且.而.具.两.丙.向.鬲.脔.龠.禹.鬻.禺---冂秉.卵.严.甫.衷.哀.衰.良.亘.事---o弱.夷.弗.弟---弓幽---山丧.举.年---十吏.束.哥---口.更.曳.曲---日画.鬯---凵东.乐---木承.拜---手.永.丞---水老.考---土叛.亟---又弑---弋重---土馘---戈命---卩册---冂噩---王产---立甩---月啬---口丝---纟赍---贝7.设定/?键为万能键。作为一个可以替代任何不会输入字根码或韵母码的成键。编码方案一将文字转变成为英文字母后,采用了经优化的160个偏旁部首构成对汉字和词组依音形编码的编码体系,声母选用其汉语拼音,并从韵母声调表(表2)选取韵母,再从字根表(表3)选取字根,然后根据声母+韵母+字根的规则进行汉字录入,《汉音语码》是一种文字编码。1.拼音规则本拼音规则与旧有的拼音方案相通,只是不用声调符号和隔音符号及写法,而把韵母分为基础韵母和声调韵母、声母分为代声母和声母。(1).声母声母由旧拼音方案中声母和代声母″v″组成。韵母把每个拼音韵母的第一声调称为基础韵母,把每个拼音韵母的第二.三.四调称为声调韵母。(韵母的拼法及写法见表2)(2).当韵母前无声母相拼时,加代声母″v″(即旧拼音方案给汉字注音时不加声母的时候加代声母″v″)。如an.ai.ou.er.写成van.vai.vou.ver。(3).韵母″er″前为代声母时读″er″调,为其它声母时读″en″调。(4).zh.ch.sh分别用;,.代替,即按;,.键时zh.ch.sh分别上屏,或在此三键上以z.c.s.的变体字或大写代替以示与z.c.s区别。如书写时可用z=zc=cs=szh=ch=sh=(5).单韵母″a.e.i.o.u″读轻声时,在其后加″z″。分别写成az.ez.iz.oz.uz.其它韵母″uo.en.ang......″读轻声时,写法与基础韵母同。(6).鼻韵母″m″与″n″的四个声调分别写成mmmbmcmd,nnnb.ncnd.加空键结束。韵母″ê″的拼法与″e″的四声拼法相同。即ee.ef.eg.eh.2.字根(见表3)(1).字根表计有160个字根,它是代表每个汉字在四个声调中所对应的字根代码。例字根″牛″---ydck(见表3)y---是表示读第一声调以″牛″为字根的汉字字根代码。d---是表示读第二声调以″牛″为字根的汉字字根代码。c---是表示读第三声调以″牛″为字根的汉字字根代码。k---是表示读第四声调以″牛″为字根的汉字字根代码。由于汉字=声母+韵母+字根组成,因此汉字的单字编码举例如下如空(kōng)的编码依规则写作komv.即声母--k韵母--om(韵母见表2ōng为om)。字根--v(字根见表3″穴″的第一声调字根代码是v)。空---(kòng)的编码依规则写作kolj.即声母--k韵母--ol(韵母见表2òng为ol)。字根--j(字根见表3″穴″的第四声调字根代码是j)。(2).对于汉字中同音同旁或同根代码的字分别以aeiou元音顺序取根[取根的先后以先常见后冷僻,即高频为先,同级字以无序根和少笔划为先(个别例外)]。①.如果同一声调中已有元音根的,则按序跳过取根。如读fān音的汉字有(依规则写作)番---fanb翻---fana藩---fane帆---fanw幡---fane*[因为在″fān″音的字根列中已出现元音根a,蕃---fani*所以跳过字根a,幡和蕃(幡比蕃多见)分别取e和i根]②.如果同一声调中元音根都以出现,则以辅音序为根。如读qiú音的汉字有(依规则写作)仇---qipd酋---qipg囚---qipv泅---qipn鼽---qipm犰---qipw遒---qipp赇---qipj裘---qipy巯---qipo求---qipu球---qipi虬---qipa俅---qipb*逑---qipe*[因为在″qiú″音的字根列中未出现元音根e,未出现的辅音根有b.c.f.....因此俅和逑(逑比俅多见)分别取e和b根。③.如果同一声调中元音、辅音根都已出现,则以韵母的变异音作为区别,字根不变,即依表3取根,变异的韵母有īíǐì分别为eueqexeyú为aeué为ueǘ为eoǜ为ioiàn为on如读jian音的汉字中,同音同旁或同根代码的字有健.溅.涧.谏.踺.锏.楗.僭(按高频为先顺序排列),由于jian音中,未出现的元音和辅音有a.e.o.和f.q.t.w.因此前八字的编码分别为joha.johe.joho.johf.johq.joht.johw.但取″僭″字时,元音和辅音根都已出现,所以″僭″字取变异韵母音on音,字根不变.即″僭″---jond④.在变异音之后有复根的在字根后加a.e.i.o.u序形成双字根.主要是用在字符集外的汉字。(3).依规则拼写的得---dezr地---dizb的---dezz也可简写为de.di.du.加空格键结束。(4).单韵母″a.e.i.o.u″读轻声时,汉字字根代码与本汉字第一声调的字根代码相同。如妈--ma.写作mazs。其它韵母″uo.en.ang......″读轻声时,字根如与第一声调中的汉字字根代码相同,按与同音同旁或同根代码取法相同。如咧---liē写作liek咧---lie写作liea3.词组编码(词组中的声母zh.ch.sh.可用代码键也可取首字母)二字词由每个字的声母和字根组成。如国家=gv+jx三字词由每个字的声母和第三字声母和字根组成。如人民币=r+m+bh四字词即以上由一.二.三字的声母和末字的声母组成。如中华人民共和国=z+h+r+g编码方案二只取声母并在韵母表(表2)中选取韵母构成单个汉字的拼音(即全拼),不取字根,就可以进行拼音码的输入。《拼音码》是先从韵母声调表(表2)中选取韵母,然后根据汉字=声母+韵母的规则进行汉字编码。是一种纯拼音编码。只要有拼音基础的人员都可利用韵母声调表(表2)配合声母进行汉字在同音同调中选择录入,并能帮助学习记忆《汉音语码》和《字元码》的字根代码。如果主要以词组进行输入,则重码少,速度快。也可进行高速盲打。1.单字编码声母+韵母(单字的韵母为基础韵母a.e.i.o.u时双写可省略。也适用于词组)2.词组编码二字词由第一字的声母和第二字的声母.韵母组成即.声+全拼或由第一字的声母.韵母和第二字的声母.韵母组成即.全拼+全拼如国家=g+jia或国家=guf+jia三字词由第一.二字的声母和第三字的声母.韵母组成即.声+声+全拼如人民币=r+m+bil四字词即以上由一.二.三字的声母和末字的声母组成。如中华人民共和国=z+h+r+g(在词组输入状态下,配合空格键可进行整个语句的输入)3.单字编码中26个简码字以一键加空格输入速度更快。简码字如下a=就b=不c=产d=的e=为f=发g=个h=和i=以j=这k=可l=了m=们n=年o=工p=国q=地r=人s=是t=他u=有v=中w=我x=学y=一z=在编码方案三根据字根表(表3)依字根的确定规则和字元码的取码规则对汉字进行字元码的输入。《字元码》是采用了经优选的160个偏旁、部首依字根表(表3),构成对汉字和词组进行编码的编码体系。《字元码》是一种形码录入方案,摆脱了键盘对字根或笔划的固定约束,形成一种动态的键盘录入方案,取消了人们对每个键位所代表的字根或笔划代码的强行记忆,而只需记住160个常用的汉字和偏旁、部首(大部分是汉字)的编码,依规则就可对所有的汉字进行编码录入,是一种字在码中,码在字中的形码录入方案。《字元码》以字根表(表3)中160个偏旁。部首为字元,代表它们在每个汉字中所出现的字元顺序代码。1.基本概念在字根码中除字根外还分为字元.音元.笔划元.零根。(1).字根字根可分为有序根和无序根.无序根是有相同字母序的字根.如氵.艹.口.木.扌.亻.纟.月.有序根是有不同字母序的字根.即159个偏旁.部首除无序根和零根外统称为有序根。(2).字元是160个偏旁.部首不作字根而在每个汉子中出现时称为字元。(3).音元是指在常见字范围内由笔划构成的有字义的笔划体.[取此字汉语拼音的首字母].见表4。(4).笔划元是指由笔划组成单个或多个相邻.相交.相连的较为固定的笔划体.一般情况下,在一个字义或同组单元内合取否则分取。按笔划的多少依欢规定为一笔o.二笔a.三笔e.四笔及以上p.复取时分别为b.c.d.p.如零根没有明显字根的汉字统称为零根.用字母o表示。2.《字元码》规则是先确定字根,后按书写顺序逐元取码,自然循环住复[最多四码]。而每个汉字的字根都是字元序中的第一码。(1).单元类型即159个偏旁部首中能独立成字的字元。以字元序为码。并列字根取前三码加空格键,副根为复取本根前二码。如(见表3).贝--vjnv厶--tly示--gjgj(2).双元类型①.字元与字元组成的汉字,循环取码(两字元相同的汉字,第三码取两字元组成的音元加空格键,无音元的以空格键结束)如浊=nane即(见表3.虫根第四码)②.字元与音元组成的汉字,循环取码。(音元的复取音元或笔划元.见表4.)如扭=tctp汞=kgud(见表4.工笔划元码)③.字元与笔划元组成的汉字,第三码先取笔划元与字元组成的音元(不足四码加空格键),无音元的循环复取笔划元。即先音后循环如由=hoy阜=fpup(3).三元类型①.以有序根结尾的汉字,取此字元的顺延编码。字根在右、下根的按规则取码。如滗=nbdj监=maec②.(a)以无序根结尾或音元[比]结尾的汉字,循环取码。船=jkkg混=nxbn(b).以(口)根与音元、笔划元组成的汉字及其o根字型,不复取(口)根及其以后笔划元,而取其整字的昔元,(不足四码,以空格键结束)如串---kkoc司---koos合---hroh束---kos谷---kbrg吏---kol衷---onkz哀---onka衰---onks事---ooks③.以连续相同字元结尾的汉字,取其相同字元组成的音元,无音循环。三字元相同的汉字取其音,无音以空格键结束。如淡=nquy硅=zhbx焱=hxv品=kkkp④.以音元或笔划元结尾的汉字,取其音元或笔划元与上一个元组成的音元,无音循环(即先音后循环)。如挎=tekk养=qoay(4).四元及以上类型①.四元按规则取码。如娱=skos挲=rnjo②.四元以上,应遵循着先字根(先正后副,先完整后相交),字元、音元、后笔划元的优先原则。按序取1.2.3.末码,字根在右、下根的,取字根外1.2.3或末码。字根在中间的则按序取码。如瀛=nkrq嗝=kkvb晓=htoa馨=hrkb斑=ewss粹=brrf(5).(o)根①.单独为音元或笔划元的循环复取。如亏=okoe非=ofop乜=oaoc②.双元的,第三码取其整字音元,无音以空格键结束。丕=obyp兮=oba爻=occ③.在笔划元中,如包含有音元的可先合后分孓=odol卅=opoc④.多元的按规则取码。亘=ooxo赢=okrn3.特殊字根″戈″字根与笔划元相交的看成是左右结构,无相交的为上下结构如。左右型戍.戴.威.臧.上下型戎.或.″冂″字根的汉字在四元以上只取″冂″根外三元,不足时取″冂″根内元。如离---冂.亠.ㄨ.凵.=uncn鬻---冂.弓.米.口.=nbjk商---冂.亠.丷.口.=unbk4.字元码的重码字表恒宣景凉篓屡笛届峻酸只叭汩汩揎兹扶抉挽搀茚茚嘻咭噎殪殂咀呙呐员呗吗咪吴呋嗷唛另叻吧邑栋栎柳栀楱榛柃龄标柰臂擘镥锏塘糖堠糇卮卯埂粳圮圯耍恧婉畹陈轹阡轩到郅郐刽燎獠羧狻猥煨烩狯煳猢炮狍旱旰暇瘕旮旭晕晖符鲋箸屠鳇篁鳊篇鲠筻鲭箐闼鞑跃趺踉阗躅髑赶矸璋幛帽瑁幞璞蛑毪馓醛饿峨峒酮崞醇馀酴岂屺驸府况贶骜赘窦赎凛廪赛骞睹褚眺祧睥裨乒乓晚冕袄袄附《汉音语》中常用字复根和变异韵母汉字(以高频为先,冷僻为后)复根(a)---唉.扒.扳.杆.揭.披.泊.沏.枢.嘶.滔.拖.芯.鸭.鹰.脂.朱拙.呵.茬.丛.德.嚎.禾.枚.摹.萍.菩.钳.挟.责.侄.芒.匕腐.橄.捡.曙.伪.舞.涌.拌.挫.锭.汗.吓.慧.近.竟.睦.泣歉.讼.喂.陷.泻.训.媚.栅.掘.假(jià)行(héng).混(hún).筑(zhú).(e)---叭.拨.搓.伊.鹦.膊.膨.蒲.乾.榕.蝇.游.抱.锉.柜.撼.溅轿.蜀.侮.拒.麓.胃.绪.逊.记.沫.(i)---吱.蓉.圆.傅.悍.做.漠.(o)---涧.括.(u)---沏.钳.树.(l)---圾.(m)---服(fù).(w)---继.(y)---寂(b)---诲.(f)---励.璃.墨(k)---滞.变异韵母(jeu)---期.(bey)---蓖.璧(shey)---侍.逝.(yey)---亦.译.屹.艾.(yio)---喻.豫.(zhey)---稚.表1正、副根及其并列根表表2韵母声调表表3字根表表4音元及其复取表表5依编码规则在汉字中出现的拼音元</tables>方法E其中R1,Q,T,X,Y和Hal定义同上。方法E按照和方法D相同的方式进行。在方法E中,用作原料化合物的式(Ⅲa”)和(Ⅲc”)化合物可以使用其中相应于羧基的部分是氰基的各种原料,按照例举的关于其中Z是羧基的上述式(Ⅲa)和(Ⅲc)的化合物的出版物所述的方法来制备。在如上所述制备的上述式(Ⅰa)、(Ⅰb)或(Ⅰc)代表的化合物中,存在着光学异构体或几何异构体(顺式或反式)。因之如果需要的话,采用光学折分或分离的化合物为原料进行上述反应,可以得到相应于所述的式(Ⅰa)、(Ⅰb)或(Ⅰc)化合物的光学异构体或几何异构体。另外,按照常规的析分或分离方法,也可以通过处理式(Ⅰa)、(Ⅰb)或(Ⅰc)代表的化合物的光学异构体或几何异构体的混合物得到个别的立体异构体。权利要求1.一种汉字拼音语言文字编码方法及其键盘,其特征在于将文字转变为英文字母后,依据字根的确立规则并依照字根表(表3)选取字根代码,韵母声调表(表2)选取拼音码,然后将其输入到常用的键位上,以此构成的对汉字进行输入的键盘。2.根据权利要求1所述的一种汉字拼音语言文字编码方法及其键盘,其特征在于将文字转变成为英文字母后,采用了经优化的160个偏旁部首构成对汉字和词组依音形编码的编码体系,声母选用其汉语拼音,先从韵母声调表(表2)选取韵母,再从字根表(表3)选取字根,然后根据声母+韵母+字根的规则进行汉字录入。3.根据权利要求1所述的一种汉字拼音语言文字编码方法及其键盘,其特征在于在韵母声调表(表2)中对单个汉字选取拼音码,声母选用其汉语拼音,不取字根,进行拼音码的输入。4.根据权利要求1所述的一种汉字拼音语言文字编码方法及其键盘,其特征在于根据字根表(表3)依字根的确定规则和字元码的取码规则对汉字进行字元码的输入。表1正、副根及其并列根表表2韵母声调表表3字根表全文摘要本发明公开了一种汉字拼音语言文字编码方法及其键盘,根据声母+韵母+字根的编码规则,采用了160个偏旁、部首构成对汉字和词组依音形编码的编码体系,形成了汉音语码。并根据声母+韵母规则形成了纯拼音输入的拼音码。根据字根规则形成以字根输入为主的形码编码即字元码。规则少,规律性强,重码少,适合会写不会拼,会拼不会写的专业、非专业人员使用,并可进行书面的文字交流,解决了汉语一字多音和通篇编码的文字转换问题。文档编号G06F3/023GK1201931SQ9811131公开日1998年12月16日申请日期1998年5月19日优先权日1998年5月19日发明者陈朝荣申请人:陈朝荣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1