介符型汉字拼音编码法及键盘的制作方法

文档序号:6406299阅读:599来源:国知局
专利名称:介符型汉字拼音编码法及键盘的制作方法
技术领域
本发明属计算机汉字处理系统的拼音编码方案及键盘设计。
目前我国在计算机文字处理方面,有拼音和拼形两种编码方法,在应用上,两种方法结合起来相辅相承的解决了一,二级汉字的计算机应用问题,但就目前已上机应用的拼音方案看,都无法较系统地解决以下问题.
1.同音字(包括多音字)的问题,同音字不能妥善处理,无法与汉字一一对应,多音字只取基本读音,或较常用的两个读音,无法反应出“拼音”码的基本形象。
2.读音及标调的问题,读音不准确往往是声调问题没有从字的组合形式上考虑,因此,在应用上成为负担和累赘,或者是只起选字作用。
3.词语的选打问题,有些音节在连读或连打时易发生误读或误打现象,如西安[xian]~鲜[xian],档案[dangan]~单干[dangan]。
4.盲打与字符串过长的问题,现行的方案,包括空键或选择键在内,每字(静频率)一般用4.5键,甚至更多,且不能最终实现盲打,不能盲打的方案,即使平均两键,三键,也无法从根本上提高速度。
5.重码及汉字容纳量问题,在GB一,二级汉字的范围内,无法从根本上消除重码,就很难容纳我国所有的汉字。
以上五项,有些方案虽然能解决其中的二项,三项,但无法从根本上全面系统的解决,因此,现行方案只是解决了计算机当前应用的问题,并没有最终解决汉字的计算机处理问题,且无法使汉字处理及语言处理实现统一。
本发明的目的,是以解决当前计算机的汉字处理方面所存在的一问题为目的进行综合分析而设计的,可读,可写,可会意,,希望能在声控系统中得到应用的汉字编码方法。
本发明的目的是这样实现的,取用26个拉丁字母做字符,便于计算机的应用,且与国际通用的书写形式一致,并规定了一个全音节组合由三个字符组成,且第一个符是声符,第二个字符是介符,第三个字符是韵符,(形符做为一种辅助字符使用时附在全音节的后面)。
一.声符它是用在一个音节组合的前面,与它后面的韵符或通过介符和韵符组合成一个音节,并代替读音的一个汉字,它由b[bo]、p[po]、m[mo]、f[fo]、d[de]、t[te]、n[ne]、l[le]、g[ge]、k[ke]、h[he]、j[ji]、q[qi]、x[xi]、r[ri],共十五个字符组成,方括号中的字母组合是该字符的读音,(下同),声符自身不能独成音节(省略形式除处),一个音节至少要有声符和韵符两部分组成。
二.韵符它是用在一个音节组合的后面,与它前面的声符或通过介符和声符组合成一个音节,并代替该读音的一个汉字,它由a[a]、o[o]、e[e]、i[ai]、y[ei]、u[ao]、v[ou]、z[an]、o[en]、s[ang]、w[eeng]共十一个字符组成,为方便计算机对汉字的处理,和有效地解决同音字问题,我们规定,有些声符也可以做韵符,我们把这种韵符叫做辅助韵符,他们和韵符的对应关系见下表
表中涉及的开口呼、齐齿呼、合口呼、撮口呼,在“介符”部分涉及到表中带“X”的读音为规定读音,它们有些占用汉语拼音方案韵母表的空格,如[i]、[ü]、[u]、[uei]、[ue]、[uan]、[uen],有些属于位值的调整,如[omng]、[ing],声符和韵符可直接组合音节,但这种音节不含声调,称不完全音节,通常用它表示该读音的一个常用字,如na(那),ma(马)、xa(下)。
三.介符、它是用在声符和韵符之间,对该音节起着定呼、标调和影响字符读音等多种作用,定呼就是确定该音节属于四呼(开口呼、齐齿呼、合口呼、撮合呼)中的哪一呼;标调就是确定该音节读四声(阴平、阳平、上声、去声、轻声)中的那一个声调,26个字符都可以作介符,介符可分为声介符和韵介符两类,这样更有利于解决汉字中的同音字问题由声符充当的介符叫声介符,由韵符充当的介符叫韵介符,为了使音节清楚,还规定韵符可用在声介符的后面,也可用在韵介符的后面,而辅助韵符只能用在声介符的后面不能用在韵介符的后面,见下表。
介符与声符,韵符结合,就使音节具备了呼和调,读音就非常准确了,如baa[bā]、mea[má]、lua[liǎ],每个组合的第一个字符是声符,第二个字符是介符,第三个字符是韵符。
又如faz、fbz、fbj[fān]、foz、fpz、fpj[fán]、fez、fmz、fmj[fǎn]、fgz、ffz、gfj[fán]上述每个读音都有三种组合形成,第一种都是韵介符,它后面带的都是韵符,第二,三两种都是声介符,其中第二种后面带的是韵符,第三种后面带的是辅助韵符。
本方案不含[zh]、[ch]、[sh]、[z]、[c]、[s]六个声符,介符中也无撮合呼,因此,它们的读音要靠介符对声符读音的影响来解决,见《声/介符配音简表》,按照《声介符配音简表》的规定,介符影响声符读音的情况如giw[zhēng]、kys[cháng]、his[shuāng]、fys[yáng]、dve[yuè]、lzz[ēr],声/介符配音简表如下
表中,“*”表示与辅助韵符组合时的读音“zhi”、“chi”、“shi”、“ri”、“zi”、“ci”、“si”表示开口呼读音。
本发明具备以下特点一,本方案共用26个拉丁字母,包括15个声符,22个韵符(其中有11个辅助韵符由声符充当),26个字符都可以做介符。
二.一个全音节由声符、介符和韵符三个字符组成,且第一个字符是声符,第二个字符是介符,第三个字符是韵符,一个全音节表示一个汉字。
三.任何一个介符都同时具有定呼,标调和影响字符读音的作用,由介符参与组合的音节读音准确。
四.由于介符集定呼,定调及影响字符读音于一身,且用在一个全音节的中间,故输入顺序与发音器官的活动顺序完全一致,本方案可用于语音控制系统,能实现语音和汉字处理的统一。
五.规定用十一个韵符做辅助形符,形符用在全音节的后面,不参与音节拼读,也不影响读音。
六.在加入形符的基础上,方案具有九万余字的容纳空间,因此,它不仅可容纳GB2312-80中的一、二级汉字、字母、标点、符号及其他发音和不发音的形体,而且能容纳我国至今发现的所有汉字,甚至包括更广泛的汉字范围,如日本字、朝鲜字等。
七.增加形符之后,实现了编码与汉字的一一对应,保证了输入无重码,且每个汉字最长码为4码,其顺序是声符、介符、韵符、形符。
八.键盘是输入的窗口,方案的全部设计均集中反映在对键盘中26个字母键的意义进行重新规定上,其中主要包括。
1.对15个声符键的规定,15个声符键的基本读音同汉语拼音方案中的声母读音,它的音变是由介符决定的。
2.对26个介符的规定,26个介符定呼标调的作用是不变的,它在与不同的声符组合时,有影响声符读音的作用。
3.韵符的读音是由声介符组合决定的,当声介符组合读开口呼时,韵符即发开口读音。
本发明与汉字对应关系的处理有两种方式一是直截替代,二是加入形符。
一.直截替代,就是由一个音节编码直截表示一个汉字,如在[jian]声中,jiv(捐),jiz(涓),jzz(鹃),在[nan]音中,noz(南),npn(难),npj(男),在[xiang]间中,xos(翔),xps(祥),xox(痒),xts(详)。
二.加入形符,是为区别同音字,扩大方案容纳量而采取的一种辅助形式,其方法是在全音节的后面加上一个不发音也不影响读音的字符一形符。
形符的表现规律是将方块的部首分成10类,分别用10个韵符表示,在应用中,可把10类部首各分成两组,A组和B组,当介符由声符充当时,韵符由韵符、辅韵符两种形式,这时带有A组部首的字与韵符相对应,带有B组部首的字与辅助韵符相对应,当介符由韵符充当时,部首不分组。
根据《形符、部首对照表》的规定,可以落实每个汉字与编码的对应关系,如在[huang]音中,hos(黄) hosa(璜)HOSE(潢) hosu(簧) hosv(蟥) hoss(癀) hqs(蝗) hqsi(煌) hqsv(鳇) hqsz(徨) hqi(凰) gqxo(隍) hqxy(皇) hqxu(篁) hqxz(惶) hqzs(遑)。
从上例可以看出,汉字的“声部”在分类中也起了相当重要的作用。
键盘设计主要表现在对各键位的定义上,由于本发明只用26个拉丁字母。因此,键盘设计也仅限于26个字母键,见《键盘字符布置图》及示图说明,如要键入,南方一词,第一键输入“n”(左上角标志声母[n],第二键输入表示开口呼阳平的介符“o”(左下角的“a”标志该键表示开口呼阳平,第三键输入韵符“z”(右上角的字母表示该韵母读音[an],第四键出现声符或标点符号、空键等功能键时就标志着第一音节在第三键结束,下一个程序开始了,如果第四键是个韵符,这个韵符即是第一个音节的形符,假设第四键输入韵符“v”那么第一个音节就不是“南”而是“蝻”了。
本发明通过上述处理手段,有效地解决了拼音码的同音字问题,实现了编码与汉字的一一对应,使读音准确,密切依附于语言使书写顺序与发音器官的活动顺序一致缩短了字符串(用键最多的字不超过四键)提高了汉字的容纳量(最高容纳量为九万汉字),从而实现了计算机汉字处理的盲打,提高了输入速度,且利于计算机对文字和语言的综合处理,沟通了我国语言建设与计算机语言,文字处理的关系。
本发明的键盘设计可参照附图给出。


图1是键盘字符布置图;
图2是韵符键位示意图;
图3是声符键位示意图;
图4是介符键位示意图。
图1中左上角字符表示声母,左下角字符表示介符(“a”表开口呼,“i”表齐齿呼,“z”表合口呼,“-”表示阴平,“/”表示阳平,“V”表示上声,“\”表示去声,无符号表示轻声,)右上角字符表示韵母,右下角汉字为形符举例。
图2中1.右上角的字母为键盘字母标志,也是韵符。
2.第一行韵母是该韵符或辅助韵符读开口呼时的读音。
3.第二行韵母是该韵符或辅助韵符读齐齿呼时的读音。
4.第三行韵母是该韵符或辅助韵符读合口呼时的读音。
5.第四行韵母是该韵符或辅助韵符读撮口呼时的读音。
6.表中的“a”表示开口呼读音,“i”表示齐齿呼读音,“u”表示合口呼读音,“u”表示撮口呼读音;zhi chi shi ri zi ci si均视为开口呼读音。
图3中1.右上角的字母为键盘字母标志,也是声符。
2.第一行的字符组合为该声母与开口和介符组合时的读音。
3.第二行的第一个字符组合为该声符与齐声式介符组合时的读音;第二个字符组合为该声符与齐韵式介符组合时的读音。
4.第三行的第一个字符组合为该声符与合韵式介符组合时的读音;第二个字符组合为该声符与齐声式介符组合时的读音。
5.第四行中的字符组合是某些组合的规定读音。
6.表中的“a”表示开口呼读音,“i”表示齐齿呼读音,“u”表示合口呼读音,“u”表示撮口呼读音;zhi chi shi ri zi ci si均视为开口呼读音。
图4中1.右上角的字母为键盘标志,也是介符。
2.左边的字母及符号表示该介符所起的作用,“a”表示开口呼,“i”表示齐齿呼,“u”表示合口呼。
如“a”表示开口呼阴平,“u”表示合口呼去声。
本发明的实施例如下(本例不含计算机处理中的人工智能及联想)一键字(编码的替代形式)如b(不) m(们) d(的) h(和)r(人)o(我)i(一)z(这)s(是)……二键字(编码简写形式)如de(得) ne(那) hu(好)ji(口)jz(见)jc(进)js(江)ju(经)……三键字(全音节字)如[jian]音中,jiv(捐)jiz(娟)jzz(鹃)[nan]音中,noz(南)npz(难)xpx(详)[xiang]音中,xos(翔)xps(祥)xpx(详)四键字(带形符字)如[huang]音中,hcse(潢)hcsu(簧)hcss(癀)hqse(湟)hqv(鳇)hqsi(煌)hqxo(隍)hqxu(篁)hqxs(遑)。
语句(字码单打)如我们 爱 科学o m eri ke x中 华 人 民 共 和 国e hca r mq grm h g另外,本方案还共存有二键简拼(即以本方案的声符,韵符为基础的)选择码,以该方案的声符,韵符为基本读音的五千词拼音选择码和以本方案的辅助形符为基础的形符选择码。
权利要求
1.一种取用26个拉丁字母做字符的介符型汉字拼音编码法,其特征是一个全音节的组合由三个字符组成,第一个字符是声符,第二个字符是介符,第三个字符是韵符,声符与后面的韵符或通过介符和韵符组合成一个音节,代表该读音的一个汉字,介符设在声符和韵符之间,对该音节起定呼,标调及影响字符读音的作用。
2.按照权利要求1所说的介符型汉字拼音编码法,其特征是所说的三个字符组成的全音节后面加有一个不发音不影响读音的字符一型符,用来区别汉字部首不同的同音字。
3.按照权利要求1所说的介符型汉字拼音编码法,其特征是所说的声符由,b、p、m、f、d、t、n、l、g、k、h、j、q、x、r共15个字符组成,韵符由a、o、e、i、y、u、v、z、c、s、w共11个字符组成,26个拉丁字母都可以做介符。
4.按照权利要求3所述的介符型汉字拼音编码法,其特征是所说的声符中的b、p、m、f、d、t、n、l、j、q、x、r字符可做为韵符,称辅助韵符,与a/o/e/i/y/u/v/z/c/s/w相对应。
5.按照权利要求2所说的介符型汉字拼音编码法,其特征是所说的型符,它是把方块汉字的部首分成10类,分别用10个韵符来表示,10类部首又可分为A,B两组,当介符由声符充当时,韵符由韵符和辅助韵符两种形式,这时带有A部首的字与韵符音节相对应,带有B组部首的字与辅助韵符相对应,当介符由韵符充当时,部首不分组,共10类部首和10个韵符的对应关系如下表形符部首对照表
全文摘要
本发明属于计算机汉字处理系统的拼音编码方案及键盘设计,方案采用了26个拉丁字母做字符,明确规定了全音节由声符、介符、韵符三个字符组成。充分发挥了介符在字符组合中所起的定呼、标调和影响字符读音的作用,从而使编码能够密切依附于语文,密切依附于汉字,在一定规律下实现了编码与汉字一一对应,有效地限制了码长,扩大了汉字容纳量,为声控与汉字的统一处理从语言和文字两个方面提供了条件。
文档编号G06F3/023GK1063948SQ9110633
公开日1992年8月26日 申请日期1991年2月9日 优先权日1991年2月9日
发明者侯同胜 申请人:兖州矿务局技工学校
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1