全拼双拼规范码汉字输入方法

文档序号:6409402阅读:918来源:国知局
专利名称:全拼双拼规范码汉字输入方法
技术领域
本发明涉及一种利用拼音向计算机输入汉字的方法,特别涉及一种语音音节全拼/双拼向计算机输入汉字的方法。
国家教委“全国中小学计算机教育研究中心”于1994制订的《中小学计算机课程指导纲要》中明确要求将汉字信息处理及汉字输入方法列入我国中小学计算机课程并作为教学内容之一。汉字编码规范的根本出路,就是要和中小学基础教育,特别是语文教学紧密地结合起来。拼音码的优势在于已有国家公布的《汉语拼音方案》标准,宪法规定要推广全国通用的普通话,拼音码又能跟国民教育基本同步,跟人们的思维过程同步,但难在不认识的字有待处理,方言土语影响普及,因此急需研制出一种既克服了上述问题而又规范的拼音码汉字输入方法。十余年来国内已出现了数百种汉字编码方案,而其中拼音码的输入方法较少,且其中存在着声韵母键住安排的规律性欠缺,以及拼音流的译码有时不够准确的不足之处,例如《智能ABC》就存在着声母zh安排在a 键上,ch安排在e键上,规律性不强的问题。诸如可能将“母亲生我前一分钟还在灶上煮饭”译成“母亲升我钱亿份钟还再早上主犯”需要进行人工干预,才能做到准确的问题。
本发明的目的是提供一种声母、韵母键位配置规范合理,能使全拼和双拼融为一体,不用切换就可向计算机输入汉字的高效全拼双拼规范码汉字输入方法。
本输入方法的技术方案是一种利用汉语拼音的全拼双拼规范码计算机汉字输入方法,其特征在于(1)单字母声母与各字母键一致,而声母zh、ch、sh用字母i、u、v表示,单韵母u用字母v表示,复韵母和鼻韵母用单字母表示,开口呼韵母配置在键盘中排,齐齿呼韵母配置在键盘下排,合口呼和撮口呼韵母配置在键盘上排,拼音互补的韵母用同一字母表示,以达到全拼与双拼输入不必切换;(2)声调一声、二声、三声、四声和轻声,分别用字母键f、x、v、h和q表示,笔画横、竖、撇、点和折,分别用字母键h、s、p、d和z表示;(3)各韵母与字母键的映射关系设定为a...a b...ianc...iu d...eie...e f...ao g...ou ng h...ani...i zh j...en k...ang l...engm...ingn...in o...o uop...ong iongq...uai ie r...uan üans...ai t...un ünu...u ch v...üshw...ui üe x...iaoy...uang iang z...ia ua(4)单字输入步骤为按拼音的全拼或双拼根据上述的声母或韵母与字母键的映射关系依次输入单字的声母和韵母;再根据屏幕提示,通过数字键0-9,选择输入对应的字;(5)词语输入步骤为a.两字词语取两字的声母韵母依次输入;b.三字词语取三字的声母依次输入,再补0输入;c.四字词语取四字的声母依次输入;d.五字以上词语取前三字及最后一字的声母依次输入。
由于采取了上述的输入方法,本发明方法的优点在于将全拼双拼输入融为一体,不用切换;双拼键位的安排,引进了频率原则和语音原则,规律性强,和中小学的拼音教学取得一致;以及单字处理分层次型和平面型,方便实用。增加了两千多个高频词语,缩短了码长,加快了输入速度。


图1是声母、韵母与国际通用小键盘字母键的映射关系图。
下面将结合附图,对本发明的汉字输入方法作详细说明。
汉语语音结构有三个层次底层是音素,中层是声韵,表层是音节。《汉语拼音方案》采用的是每个音节包含1--6个字母的音素制。现代汉语中,声母有21个,韵母有39个,加起来是60个。拉丁字母只有26个。在《汉语拼音方案》中,除声母zh、ch、sh用双字母表示外,绝大多数声母都用一个字母表示;相反,除草韵母用一个字母表示外,绝大多数韵母都用2-4个字母表示。
关于《汉语拼音方案》的键盘化问题,由于《汉语拼音方案》是拉丁化的音素制方案,和国际通用小键盘上的拉丁字母基本上是一一对应的,因此只有两个问题需要作特殊处理。
国际通用键盘上没有ü,现规定用字母v表示。理由是v在《汉语拼音方案》中是闲置不用的;v和ü形状近似,易为人们所接受。
声调是汉语语音系统的重要组成部分,有表义作用,不是可有可无的。在国际通用小键盘上,编码一般只用26个拉丁字母键,不用10个数字键,因此需要采用字母标调法。现规定一、二、三、四声和轻声分别用字母f x v h q表示。主要理由是①f中间的一横和一声的调号形状相同,x的第一笔和二声的调号形状相同(只是书写顺序相反),v和三声的调号形状相同,h的末笔和四声的调号形状近似(方向一致),q是取轻声的“轻”字的声母;f x v h在键盘上构成一个平行四边形,分布在中排和下排,既有利于键位布局,也有利于记忆。
声韵双拼体制是和“音素制”(汉语拼音方案)相对而言的。双拼键位是以《汉语拼音方案》为基础,用两个字母表示声韵相拼,实行首位表声、末位表韵的“位读法”。例如雄”,音素制写成“xiong”,需用五个字母;双拼制写成“xp”,只用两个字母,用“P”代表“iong”。全拼和双拼,就内容而言,二者的信息量是等值的;就形式而言,后者以前者为基础,是前者信息量的外部压缩形式。
由于双拼制要求“一个音节只能用又必须用两个字母表示”,因此出现了三种情况①多于——多于两个字母的要压缩,在全部音节中占大多数,例如“昂”ang--->a+ng--->ag(将ng压缩成g);②少于——少于两个字母的要补足,办法是将该字母重复一次,在全部音节中占极少数,例如“俄”e--->ee;③等于——等于两个字母的不增不减,在全部音节中占少数,例如“大”da->da。
下面的声母和韵母与字母键的映射关系图1及声韵转换对应表一和表二,从两个不同的角度进行排列,使用起来是等效的,可以并用,也可以单独用。
现在本照图1说明本发明方法中双拼键位技术方案如下①绝大多数声母及单韵母和《汉语拼音方案》规定的字母相同;②声母zh、ch、sh分别压缩成一个字母,用i、u、v表示;③单韵母u用v表示;④复韵母和鼻韵母,一律用单字母表示,例如ao用f表示,ian用b表示;⑤根据语音互补原则,有的同一个字母要表示两个韵母,例如p表示ong和iong;⑥合口呼韵母和撮口呼韵母存在互补关系,合并表示,例如r既表示uan,也表示üan;⑦一声、二声、三声、四声和轻声,分别用字母f x v h q表示;⑧笔画横、竖、撇、点、折,分别用字母h s p d z表示。
第一,一般声母和双字母声母的处理声母按发音部位分为七组①双唇音b、p、m②唇齿音f③舌尖前音z、c、s,④舌尖中音d、t、n、l,⑤舌尖后音zh、ch、sh、r⑥舌面音j、q、x⑦舌根音g、k、h。一般声母按照国际通用小键盘的键位安排,不作变动。例如“g”依旧安排在“G”键上。
双字母声母zh、ch、sh分别用i、u、v表示。①表示双字母声母的键位,只有i、u、v三个字母,没有选择余地;②记忆方法是i像树枝形,含zh音;u像水池形,含ch音;v像打时钩,表示“是”,含sh音。
第二,零声母的处理声母是音节的第一个要素,每一个字都有它的声母,但有些音节不以辅音为声母,却以元音开头,习惯上,把这一类声母叫“零声母”,零声母约占5%。在双拼方案中,①以a o e打头的零声母,基本上用原形,只有ang压缩成ag;②以y w打头的首字母保持不变。
第三,单韵母、复韵母和鼻韵母的处理韵母按结构分成单韵母、复韵母和鼻韵母,一共39个。拼音方案本身合并了四个其中“i”既代表舌面前音,又代表两个舌尖音,即zi、ci、si后面的“i”和zhi、chi、shi、ri后面的“i”;“u”既代表舌面后音,上面加上两点后又代表舌面前音;“e”既代表舌面后音,上面加“^”后又代表舌面前音,后面加“i”、“r”时又代表央元音。
①单韵母基本上按照国际通用小键盘的键位安排,a、o、e、i、u的位置不作变动;但ü用v表示。
②复韵母基本上安排在键盘中线的左侧,鼻韵母基本上安排在键盘中线的右侧,如中排中线右侧是鼻韵母an、en、ang、eng,而左侧是复韵母ai、ei、ao、ou。
③复韵母和鼻韵母的压缩技术按照声韵拼合规律,复韵母和鼻韵母可以归并为八组上排七组,下排一组 ④韵母“四呼”的键面排列由于上排单韵母i(16.5)、u(6.9)、e(10.2)频度较高,故而将频度较低的合口呼、撮口呼安排在上排,开口呼安排在中排,齐齿呼安排在下排。
第四,声调的处理声调用字母键f、x、v、h、q表示阴平、阳平、上声、去声、轻声。
表一是按字母顺序检索表——每个字母的右方为其代表的韵母或声母表 一a----a n----inb----ian o----ouoc----iu(iou) p----ong iongd----eiq----uai iee----e r----uan ǖanf----aos----aig----ou ngt----ǖn un(uen)h----anu----uchi----i zhv----ǖchj----enw----ǖe ui(uei)k----ang x----iaol----eng y----uang iangm----ing z----ia ua
表二是按韵母顺序反查表——括号内是代表韵母的字母表二
本发明的汉字拼音编码输入方法,使全拼双拼不用切换,二者并存并用,处在一个系统之中。处理汉字的内容完全相同。配上双拼键帽,再加上双拼键入用全拼显示,形式上完全与全拼一样。
为什么全拼双拼能够融为一体呢?关键在于全拼方案音节中,第二个字母(除双字母声母外)却是元音,与双拼方案音节中第二个字母的元音完全重合;双拼方案音节中,表示韵母的有21个辅音,与全拼方案的第二个字母(均为元音)就完全区别开来了。
就全拼双拼的音节模式来说,音节由声母和韵母构成,约占全部音节的95%。下面分解式中的“+”号,表示声韵相加。
ba---->b+a---->ba ju---->j+u---->julai--->l+ai--->ls guang->g+uang-->gyshuai->sh+uai-->vqn ü--->n+ü--->nvtuan-->t+uan-->tr zuo--->z+uo--->zo从音值讲,ju(举)中的韵母是ü而不是u。按照《汉语拼音方案》规定,j、q、x和ü相拼,ü上两点省略,而nü(女)上的两点不能省略。因此ju中的ü仍写作u,而nü中的ü要转换成v。请记住v只用于和n、l相拼。
另外,音节由零声母构成,约占全部音节的5%。下面分解式中的“+”号,只表示首字母和后面的字母相加。
yi--->y+i--->yi wai---->w+ai---->wsyuan->y+uan->yr ang---->a+ng---->agou--->o+u--->ou e------>e--------->ee所谓零声母,指的是一个音节中没有辅音声母而本身能自成音节的韵母。例如an在han(汉)中是韵母,又可以自成音节an(安)。在《汉语拼音方案》中,像an,不管是作韵母还是作零声母,都写作an,字母形式不变;而像ian,只能作韵母用,例如jian(间),作零声母时,要写作yan(烟)。在双拼键盘中,作韵母和作零声母是两套字母形式。例如an,作韵母时转换成h(bh办);作零声母时,仍写作an(安)。又如ian,作韵母时转换成b(jb间);作零声母时转换成ian--->yan--->yh(烟)。
本发明的汉字拼音编码输入方法中,采取层次型和平面型结构排序,进行单字输入。
层次型(各个层次既可独用,也可兼用)分为二元声+韵三元声+韵+调四元声+韵+调+画示例全拼shi 1事2实3市4式5试6视7世8史9石0示双拼vi 1事2实3市4式5试6视7世8史9石0示说明层次型的屏幕显示,每一提示行显示10个,按降频排序;平面型(每个平面既可独用,也可兼用)指的是声+韵+调说明平面型的屏幕显示,击一键和二键时,每一提示行显示1个,只作为高频字对待,并在声韵调三键时重复出现。只有声韵调(三键)处在一个平面时,才显示10个,按降频排序。
本方法的层次型中单字处理采取的技术措施包括①四码能够解决全部同音字问题。声级字只声母一码,声韵字两码,声韵调三码,声韵调画四码,再加数字选择键,一共四码五键即可全部解决问题。
②容纳国标基本集汉字有足够的容量。容量足以超过任何一个同音字组数,理论上讲可以分流250个字以上的同音字,而《基本集》中最多的一组同音字才103个。
③同级字只需一屏显示,不翻页。同级字指的就是一屏10个字,如果翻屏就已是下一级字。同级字所用信息相同,比如,一屏10个字所用声韵信息相同。例如zhi 1.直2.值 3.指 4.至5.支 6.制 7.治 8.知 9.志 0.质,这10个字是同级字,同级字之间只有数字选择键不同。
④不等长、非全息。不等长指的是输入码长不等,如“是”“生”“视”“势”“弑”,这五个汉字分别为不同的级次字,码长从1至4码不等,并不是每一个汉字都需要声韵调画的全息输入,很多高频常用汉字,如“生、视”只取其声或声韵即可输入。
⑤高频先见。高频先见的两个含义是不同级次间相互比较,其频度递减,级次越高,频度越高,反之,越低;同级字之间相互比较,频度呈现由左向右递降趋势,即标号越小频度越高,反之,越低。
⑥区分词字和词素字。在同一级中,将词字安排在第一个或前几个,如“义”的频度高于“已、易”,但“义”不单用,为词素字,故放在“已、易”之后;在上下级中,将词字安排在上级,词素字安排在下级。如“民”是词素字不单用,可组词为“民族 民主人民公民 国民”,在国标一级汉字降频定序中“民”是第46位,在声母M里处第2位,应在声级,鉴于它是词素字,单用机会少,故放在声韵级。
⑦同旁字归并,便于扫描。这种措施在安排频率低的同级字中,特别有用。一组同音字拥有相同偏旁,如“螟、瞑、瞑、溟、冥”,读音ming,共同都有“冥”,将这些同声旁的同音字依次排列在同一级中,便于扫描,迅速发现所找汉字,也便于定位记忆,另如“忠、钟、肿、仲、哀、盅”等。
⑧熟字、生字按音统一排序,以熟带生。二级字中有许多是生字,念不准读音,把它们和人们熟知的字排在一起,用熟识的字的读音念生字的读音。例如yihd 1.诣2.裔3.弈4.奕5.熠6.翊7.怿8.悒9.癔0.瘗。通过认读“诣”“奕”这些熟知的字,就可以认识“怿”“瘗”这些生字。
任何事物都是分层次展开的,这是共性,是普遍规律,汉字的频率分布也不例外,主要体现在汉字频率分布的不均衡性上。一个汉字是否被选入,次数多少,都受书面交际过程中字所书写的词的应用频率所制约,有的运用率很高,有的奇低,表现出了文字在使用当中的不均衡性。
汉字频率分布的不均衡性反映到级次定位法中,就是编码的不等长性。遵循汉字的不同使用频率,施以不同的码长,使用频率高,码长就短,反之,则长。如“以”降频排第28位,只需键入声母“y”,码长为1,“屹”降频排第3324位,必须键入声韵调画“yihs”,码长为4。充分利用声韵调信息,这和国民教育背景是一致的。不等长的级次定位法有两个显著的特点首先,级次间相互关联,相互依存,在上一级出现过的字,下一级一般不出现,上下级的汉字间是不等长的。其次,级次间是递加的关系,一个汉字在声级里找不到,不必退回,加韵这一级信息,成为声韵级,以此类推。
“息”指信息,全息和非全息各有各的用途。汉字输入与英文不同,英文输入必须是全息的,将组成英文单词的所有字母信息一一输入,丝毫不差。汉字教学是全息的,要一笔一画、一声一调地学习,而汉字输入则可以是非全息的,以非全息的形式输入全息的内容,不管是音码还是形码,历来都是如此。例如输入词语时,一般都只取每个字的首码信息,而输入的却是整个词语,故而非全息主要指的是信息的压缩技术。这是中英文输入的最大不同,也是输入速度超过英文的主要原因。通过层次型显示和平面型显示本发明的输入方法具有快速输入能力。
在词语输入中,一般却是不用声调的,笔画更是使用不上。本发明的输入方法中词语按“非全息”的方法输入。双字词语声韵声韵示例相信 伟大全拼xiangxin weida双拼xyxn wdda三字词语声声声o示例对不起为什么全拼dbqowshmo双拼dbqowvmo四字词语声声声声示例全心全意这就是说全拼 qxqyzhjshsh双拼 qxqyijvv五字以上前三末一示例中华人民共和国全拼 zhhrg双拼 ihrg
权利要求
1.一种利用汉语拼音的全拼双拼规范码计算机汉字输入方法,其特征在于(1)单字母声母与各字母键一致,而声母zh、ch、sh用字母i、u、v表示,单韵母ü用字母v表示,复韵母和鼻韵母用单字母表示,开口呼韵母配置在键盘中排,齐齿呼韵母配置在键盘下排,合口呼和撮口呼韵母配置在键盘上排,拼音互补的韵母用同一字母表示,以达到全拼与双拼输入不必切换;(2)声调一声、二声、三声、四声和轻声,分别用字母键f、x、v、h和q表示,笔画横、竖、撇、点和折,分别用字母键h、s、p、d和z表示;(3)各韵母与字母键的映射关系设定为a...ab...ian c...iu d...eie...ef...aog...ou ngh...ani...i zh j...enk...ang l...engm...ing n...ino...o uo p...ong iongq...uai ie r...uan u an s...ai t...un unu...u ch v...üsh w...ui üex...iaoy...uang iang z...ia ua(4)单字输入步骤为按拼音的全拼或双拼根据上述的声母或韵母与字母键的映射关系依次输入单字的声母和韵母;再根据屏幕提示,通过数字键0-9,选择输入对应的字;(5)词语输入步骤为a.双字词语取两字的声母韵母依次输入;b.三字词语取三字的声母依次输入再补0输入;c.四字词语取四字的声母依次输入;d.五字以上词语取前三字及最后一字的声母依次输入。
2.根据权利要求1的汉字输入方法,其特征在于,上述的单字输入步骤还包括根据上述的声调和字母键的映射关系,施行所述字的声调输入,以及根据层次型的屏幕显示,每一提示行10个,按降频排序,通过数字键,选择所需要的字输入。
3.根据权利要求1或2的汉字输入方法,其特征在于,上述的单字输入步骤进一步包括根据上述的笔画与字母键的映射关系,施行所述字的笔画输入。
4.根据权利要求1的汉字输入方法,其特征在于,上述的单字输入步骤还包括平面型屏幕显示,击一键和二键时,每一提示行显示一个字,只有声韵调相继输入处在一个平面,才显示10个字,且按降频排序,通过数字键,选择输入。
全文摘要
本发明提供一种全拼双拼规范码计算机汉字输入方法,它具有各韵母、声母和笔画与国际通用小键盘各字母键的映射关系,执行层次型或平面型输入。本方法实现了全拼和双拼融合不必切换;双拼键位的安排,引进频率原则和语音原则,规律性强,和中小学的拼音教学取得一致,以及单字输入分层次和平面型,方便实用。并加入了高频词语的简码,缩短了码长。
文档编号G06F3/023GK1150272SQ9511941
公开日1997年5月21日 申请日期1995年12月25日 优先权日1995年12月25日
发明者华绍和, 肖金卯, 陶沙, 程女范, 蒋顺炳 申请人:中国中文信息学会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1