计算机汉字、符号的输入方法

文档序号:6607070阅读:559来源:国知局
专利名称:计算机汉字、符号的输入方法
一种计算机汉字、符号的输入方法属于计算机汉字、符号信息处理技术领域。
目前市场上盛行的汉字输入方法,从总体上可以分成两类一类是以字形为主的汉字输入方法,另一类是以字音为主的汉字输入方法即拼音法。前者拆字组字过于繁琐,选取字根又各有其规定需要死记硬背,增加了人们学习的难度,而后者重码率太高,打字速度慢。另外,众多的汉字输入方法还未对符号进行编码,还停留在区位码中查找或设立动态健查找的阶段,对用户及专业打字员带来很大的不便。
本发明的目的在于提供一种形音结合、规则简单、重码少的计算机汉字、符号输入方法。
本发明所提出的汉字输入方法的特征在于它是一种根据汉字的具体结构把汉字划分成若个字元,用普通话拼音标准对组成汉字的字元进行编码,其汉字的输入步骤依次如下(一)、本发明对汉字作如下规定将汉字的笔画分为点(丶),横(—)、直(丨)、撇(丿)、捺、提和钩(所有带拐弯的笔画)七种;将构成汉字的相对独立部分统称为偏旁。偏旁包括子字、类字型偏旁和非规则型偏旁三种;如果构成某汉字的相对独立部分也是一个汉字,则称这部分为此汉字的子字。有些子字与源字的笔画稍有不同,这类子字称为变体子字。如果某汉字的子字的读音的第一个字母与该汉字读音的第一字母相同,则称该子字为同音头子字;有些汉字的相对独立部分虽然不是子字,但经常作为独立部分出现在汉字中。这类相对独立的部分为类字型偏旁。但为了方便,本发明规定只有在下面“类字型偏旁表”内出现的偏旁,才属类字型偏旁。
类字型偏旁表 本发明将“十、日、山、虫、木、门、雨、月、气、厶、鱼、八、竹、口、心、爪”等十六个子字及其变体也列入类字型偏旁,并命明为顺口助记的类字型偏旁名称;
列入类字型偏旁的子字 以上子字中,要注意围字框“囗”与子字“口”的区别,“囗”比“口”的轮廓开关更大,一般应起包围作用,或与一交叉笔画相交。而“日”与“曰”则无区别,不管其轮廓形状大小,都是“出头日”汉字内除子字和类子型偏旁以外的相对独立部分,都称为非规则型偏旁。相对独立的七种基本笔画也属非规则型偏旁。“一”作为偏旁出现在汉字内时,只看成非规则型偏旁(横)画,而不是子字;本发明将汉字的第一画统称为首笔,第二画统称为次笔,最后一画统称为末笔;本发明将汉字及偏旁名称的读音第一个汉语拼音字母统称为音头;一般的非规则型偏旁没有具体的名称,因此也没有它自己的音头。基本笔画作为特殊的非规则型偏旁,它具有自己的名称,因此它就有了自己的音头。
英文字母共有26个,其中用作汉语拼音第一字母的只有23个,还剩i、u、v三个,另外字母o的使用率也很低。为了降低重码率及输入方便。本发明将字母i、u、o、v用作无具体名称的非规则型偏旁的统配音头。
通配音头i、u、o、v的使用方法如下从上下结构拆分出来的部分,如果是基本笔画以外的非规则型偏旁,编码时用字母i作音头。
从左右结构拆分出来的部分,如果是基本笔画以外的非规则型偏旁,编码时用字母u作音头。
从包围结构拆分出来的部分,如果是基本笔画以外的非规则型偏旁,编码时用字母o作音头。
从隔离结构拆分出来的部分,如果是基本笔画以外的非规则型偏旁,编码时用字母v作音头;本发明将汉字的结构分为上下分体结构、左右分体结构、包围分体结构、隔离分体结构、上下连体结构、左右连体结构、包围连体结构、隔离连体结构、上下虚连结构、左右虚连结构、包围虚连结构、隔离虚体结构、交一交叉结构、非交一交叉结构、独体结构等十五种结构类型。
所谓分体结构是指由几个笔画不相交不相连部分组成的汉字结构。
上下分体结构字例有“恩、垦、杰、字”等。
左右分体结构字例有“伟、稿、劝、非”等。
包围分体结构字例有“围、庆、甸、匡、斗、风、凶、建”等。
隔离分体结构字例有“噩、幽、爽、乘、坐”等。
所谓连体结构是指由一个结构简单部分与一个结构紧凑子字或类字型偏旁紧紧相连而成的汉字的结构。
上下连体结构字例有“禾、兀、虫、缶、生、击、文、亡”等。
左右连体结构字例有“几”,“非”字的左边部分和右边部分分别是左右连体结构部分。
包围连体结构字例有“斤、厅、巨、丑”等。
隔离连体结构字例有“束、秉、果”等隔“八”的字。
所谓虚连结构是指由一个结构简单部分与一个结构紧凑子字或类字型偏旁似连非连、不即不离、相互叠加而成汉字的结构。
上下虚连结构字例有“呙、圭、奚、尔、广、户、糸、羊、关、肖”等。
左右虚连结构字例有“隹”。
包围虚连结构字例有“左、有、寿、反、扁”等。
隔离虚连结构字例有“乎、柬、东、火”等。
所谓交叉结构是指由几部分交叉重叠而成的汉字的结构。交叉结构分交一结构和非交一交叉结构两种。
交一交叉结构是指一个简单子字或类字型偏旁或类字型偏旁添加一交叉笔画而形成的汉字的结构。例如“甲、电、五、戈、也、夫、井、巾”等。为了便于拆分,音头码规定由两交叉笔画组成的汉字不属交一交叉结构。因此“十、九”不属交一交叉结构。
非交一交叉结构字例有“重、里”等。
独体结构是除连体结构和交叉结构以外的结构紧凑、笔画相连或相交的汉字结构。例如“一、已、巳、己、弓、乙、凹、凸、女”等。
一个汉字可能只属于一种结构类型,也可能是上述几种结构类型的组合。例如“晶、暂、揉、熔、锎”等。
(一)、对汉字进行拆分拆分汉字是汉字编码的基础,如果汉字拆分的程度不够,汉字编码时重码多,汉字输入的速度就慢。但汉字拆得过细,拆分汉字所需的时同增多,同样会影响汉字的输入速度。本发明拆分汉字时,最多只将汉字拆分成三部分,对于难拆分的汉字,则干脆不拆,从而达到拆分适当确保汉字输入速度之目的。其具体规则如下1、独体和非交一交叉结构汉字不拆分。
例如“女、又、重”等。
2、类字型偏旁和已划归类字型偏旁的汉字不拆分。
例如“氵、宀、_、月、竹、气”等。
3、交一交叉结构汉字只拆分成两部分。
例如甲=日+丨有多种拆分方案时,交叉笔画能取首笔则取首笔,不能取首选场则取末笔。
例如井=一+ 4、隔离结构汉字只拆成两部分。
例如坐=从+土乎=于+八5、复合结构汉字的拆分对于复合结构汉字,本发明按“二次二分”法进行拆分。所谓“二次二分”法,就是根据拆分优先级先将汉字拆分成两部分,再将应先拆分的部分拆分成两小部分,拆分优先级分如下三种结构拆分优先先级隔离分体结构>上下分体结构或左右分体结构>包围分体结构>上下虚连结构>左右虚连结构>包围虚连结构>隔离虚体结构>上下连体结构>左右连体结构>包围连体结构>隔离连体结构>交一交叉结构>独体结构非交一交叉结构。
拆分条件拆分优先级
非规则型偏旁>同音头子字>子字拆分结果拆分优先级子字多>变体子字多>类字型偏旁多>基本笔画>其他非规则型偏旁拆分优先级均相同时笔画多优先。
6、特殊结构汉字的拆分。
连体结构拆分成的连体结构或交一交叉结构不再拆分。
例如王=一+土;夭=丿+大两对称部分组成的汉字先一分为二再拆后者。
以中间为轴上下对称的汉字直接拆分成上中下三部分。
非规则型偏旁包围一画的结构均最后考虑拆分。
例如戌=戊+一废=丶+厂+发尊=八+酉+寸第一次拆分后,如果第二次应扩分的部分是由上中下三分体部分或左中右三分体部分组成的,而且上下或左右两部分的偏旁类型相同且笔画数相等,就拆成上或左和中下或中右两小部分。
左中右复合分体汉字直接拆分成左中右三部分,但属隔离分体者仍按隔离分体拆分。
例如翎=令+习+习既含分体隔离体又含连体隔离体(或虚连隔离体)的隔离结构汉字按包围结构拆分,隔“八”的隔离结构只按隔离虚连结构或隔离连体结构拆分,隔三点结构只按隔离分体结构拆分。
例如武=一+弋+止省=小+丿+目含“人”结构按上下结构拆分,不按包围结构拆分。
含“亥”结构按上下连体结构拆分,不按包围连体结构拆分。
含“朱”结构按上下连体结构拆分,不按包围连体结构拆分。
含“石”结构按包围虚连结构拆分,不按下下虚连结构拆分。
既属连体结构又属交一交叉结构汉字按交一交叉结构处理。
为了习惯成自然,极个别汉字拆分时可不受结构扩分优先级的限制。
例如标=木+二+小,瞠=目+尚+土,锁=钅+小+贝三、对汉字进行编码1、对字进行编码。
a、不可拆分的字,其编码规则是当该汉字为独画字时,其编码为该字音头加该画音头共两个字母;当该汉字为两画字时,其编码为该字音头加首笔音头再加末笔音头共三个字母;当该汉字为三画及三画以上汉字时,其编码为该字音头加首笔音头加次笔音头再加末笔音头共四个字母。
b、对“十、日(日)、山、虫、木、门、雨、月、气、厶、鱼、八、竹、口、心、爪”等十六个已划入类字型偏旁的汉字,其编码是为字音头加偏旁名称的字音头,共四个字母。即十(sasp)日(rctr)曰(yctr)山(shsp)虫(cicp)木(mlmp)门(mmzk)雨(ynzy)月(yoyp)气(qpqt)厶(sqzd)鱼(yuyp)八(bvbp)竹(zwzt)口(wwzk)心(xxzd)爪(zzzd)c、可拆分的字,当拆分结果只有两个部分时,如果两个部分均非同音头子字,其编码为字音头加第一个部分的音头再加第二个部分的音头,共三个字母;如果两个部分中有一个部分是同音头子字,其同音头子字部分应取两音头(同音头子字的首笔音头和末笔音头),其编码规则为字音头加非子字部分音头和同音头子字字首笔音头及末笔音头(音头排列顺序与笔画顺序相同),共四个字母;如果两部分均是同音头子字,则按均非同音头子字处理,其编码规则为字音头加第一部分的音头再加第二部分的音头,共三个字母;当拆分结果有三个部分的汉字时,其编码规则为字音头加按拆分结果总序排列而成的各部分音头。共四个字母。
d、当国标类字型偏旁单独出现时,其编码规则为其偏旁名称的前三个字的音头(仅艹特别,其编码为cvct),基本笔画单独出现时的音头码为笔画名音头的四次重复。
氵(aps)宀(bgt)勹(byk)疒(bzk)艹(cvct)中(czt)夂(dat)冫(dsp)忄(exp)卩(edb)阝(edp)攵(fwp)犭(fqp)讠(fyp)亠(gzt)礻(gsp)_(HZT)廴(jzk)纟(jsp)刂 (ldp) (nzd)冖(pbg)饣(psp)匚(qzk)钅(qdj)亻(rzp)彡(spp)灬(sdd)冂(tzk)凵(xzd)扌(xsp)彐(xat)肀(yxt)衤(yzp)丬(zzp)辶(zzk)、(dddd)丿(pppp)丨(zzzz)2、对词组进行编码a、两个字组成的词组其编码规则为第一个字编码中的第一个字母加第二个字编码中的第一个字母再加第一个字编码中的第二个字母再加第二个字编码中的第二个字母再加第一个编码中的第三个字母,但当第一个字编码中只有两个字母时则第一个字编码中的第三个字母改为第二个字编码中的第三个字母,如果两个字的编码都只有两个字母该词组的音头码只有前面四个字母;b、三个字组成的词组其编码规则为第一个字编码中的第一字母加第二个字编码中的第一个字母再加第三个字编码中的第一字母加第一个字编码中的第二个字母加第二个字编码中的第二个字母;
c、四个字组成的词组其编码规则为第一个字编码中的第一字母加第二个字编码中的第一个字母再加第三个字编码中的第一字母加第四个字编码中的第一个字母加第一个字编码中的第二个字母;d、五个及五个以上字组成的词组其编码规则为第一个字编码中的第一字母加第二个字编码中的第一个字母再加第三个字编码中的第一字母加第四个字编码中的第一个字母加最后一个字编码中的第一个字母。
3、简码本发明共设置了常用字简码、地名简码、人名简码、国名简码和单位简码五种简码。
a、常用字简码共有二十三个,它们分别是各编码字母区域内最常用字的汉字这二十三个汉字及其简码为爱(a)不(b)此(c)的(d)而(e)发(f)各(g)和(h)就(j)可(k)了(l)没(m)你(n)欧(o)平(p)请(q)人(r)是(s)他(t)我(w)小(x)于(y)在(z)b、地名简码内设置了国内常见的两至三个字的简码,输入时只需键入o加名字的字音头即可。
c、人名简码内设置了一些较有名的人的名字简码,输入时也只需键入i加相应名字的字音头即可。
d、国名简码内设置了两字词的国名及其语言和名城的简码,输入时也只需键入u加相应名称的字音头即可。
e、单位简码内设置了常见的一至三字计量单位的简码,输入时也只需键入v键加该单位名称的字音头即可。
光年(vgn)年(vn)月(vy)日(vr)天(vt)小时(vxs)
时(vs) 分钟(vfz) 秒钟(vmz) 分(vf) 秒(vm) 毫秒(vhm)公里(vgl) 千米(vqm) 英里(vyl) 海里(vhl) 里(vl)米(vm) 分米(vfm) 厘米(vlm) 毫米(vhm) 微米(vwm)丈(vz) 尺(vc) 寸(vc) 英尺(vyc) 英寸(vyc) 码(vm)公顷(vgq) 平方米(vpfm) 亩(vm) 立方米(vlfm) 升(vs)毫升(vhs) 吨(vd) 磅(vb) 公斤(vgj) 斤(vj) 两(vl)钱(vq) 克拉(vkl) 盎司(vas) 千克(vqk) 毫克(vhk)克(vk) 牛顿(vnd) 达因(vdy) 帕斯卡(vpsk) 巴(vb)毫巴(vhb) 大气压(vdqy)焦耳(vje) 焦(vj) 尔格(veg)千卡(vqk) 卡(vk) 大卡(vdk) 度(vd)瓦特(vwt) 马力(vml)安培(vap) 安(va) 毫安(vha) 库仑(vkl) 伏特(vft)毫伏(vhf) 伏(vf) 法拉(vfl)奥斯特(vast) 高斯(vgs) 韦伯(vwb) 亨利(vhl) 欧姆(vom)分贝(vfb)摩尔(vme) 克分子(vkfz) 克当量(vkdl)摄氏度(vssd) 华氏度(vhsd)弧度(vhd)元(vy) 角(vj) 日元(vly) 美元(vmy) 美分(vmf) 马克(vmk)英镑(vyb) 港元(vgy) 澳元(vay) 欧元(voy) 里拉(vll)泰铢(vtz) 法郎(vfl) 盾(vd) 先令(vxl) 比索(vbs)卢布(vlb)本发明还对国标202个符号进行重新命名,其名称如下表 对上述重新命名过的国标符号其编码规则是该符号名称的字音头的组合,但名称为一个字的符号除外,其编码规则为该字汉语拼音的前四个字母。
另外,本发明还开发了查询功能,如有不知音头的部分可用“?”替代。
对把编码好了的字或词组或符号,只需依照该编码符号的顺序依次按下键盘上相应的符号键,就可输入汉字或词组或符号。
权利要求
1.一种计算机文字的输入方法,其特征是由下列步骤完成的(一)重新规范汉字的笔画和偏旁部首的名称
(二)对汉字进行拆分,其拆分规则如下1)独体和非交一交叉结构汉字不拆分;2)类字型偏旁和已划归类字型的汉字不拆分;3)交一结构汉字只拆分成两部分;4)隔离结构汉字只拆成两部分;5)复合结构汉字的拆分,先按拆分优先级将汉字拆成两部分,再按拆分优先级将两部分中的一部分拆分成两小部分;(三)编码1)对字进行编码a、不可拆分的字,其编码规则是当该汉字为独画字时,其编码为该字音头加该画音头共两个字母;当该汉字为两画字时,其编码为该字音头加首笔音头再加末笔音头共三个字母;当该汉字为三画及三画以上汉字时,其编码为该字音头加首笔音头加次笔音头再加末笔音头共四个字母;b、对“十、日或日、山、虫、木、门、雨、月、气、厶、鱼、八、竹、口、心、爪”等十六个已划入类字型偏旁的汉字,其编码是为字音头加偏旁名称的字音头,共四个字母;c、可拆分的字,当拆分结果只有两个部分时,如果两个部分均非同音头子字,其编码为字音头加第一个部分的音头再加第二个部分的音头,共三个字母;如果两个部分中有一个部分是同音头子字,其同音头子字部分应取两音头即同音头子字的首笔音头和末笔音头,其编码规则为字音头加非子字部分音头和同音头子字字首笔音头及末笔音头,共四个字母;如果两部分均是同音头子字,则按均非同音头子字处理,其编码规则为字音头加第一部分的音头再加第二部分的音头,共三个字母;当拆分结果有三个部分的汉字时,其编码规则为字音头加按拆分结果总序排列而成的各部分音头,共四个字母;d、当国标类字型偏旁单独出现时,其编码规则为其偏旁名称的前三个字的音头,但艹特别,其编码为cvct,基本笔画单独出现时的音头码为笔画名音头的四次重复;2)对词组进行编码a、两个字组成的词组其编码规则为第一个字编码中的第一个字母加第二个字编码中的第一个字母再加第一个字编码中的第二个字母再加第二个字编码中的第二个字母再加第一个编码中的第三个字母,但当第一个字编码中只有两个字母时则第一个字编码中的第三个字母改为第二个字编码中的第三个字母,如果两个字的编码都只有两个字母该词组的音头码只有前面四个字母;b、三个字组成的词组其编码规则为第一个字编码中的第一字母加第二个字编码中的第一个字母再加第三个字编码中的第一字母加第一个字编码中的第二个字母加第二个字编码中的第二个字母;c、四个字组成的词组其编码规则为第一个字编码中的第一字母加第二个字编码中的第一个字母再加第三个字编码中的第一字母加第四个字编码中的第一个字母加第一个字编码中的第二个字母;d、五个及五个以上字组成的词组其编码规则为第一个字编码中的第一字母加第二个字编码中的第一个字母再加第三个字编码中的第一字母加第四个字编码中的第一个字母加最后一个字编码中的第一个字母;3)简码本发明共设置了常用字简码、地名简码、人名简码、国名简码和单位简码五种简码a、常用字简码共有二十三个,它们分别是各编码字母区域内最常用字的汉字这二十三个汉字及其简码为爱简码为a、不简码为b、此简码为c、的简码为d、而简码为e、发简码为f、各简码为g、和简码为h、就简码为j、可简码为k、了简码为l、没简码为m、你简码为n、欧简码为o、平简码为p、请简码为q、人简码为r、是简码为s、他简码为t、我简码为w、小简码为x、于简码为y、在简码为z;b、地名简码内设置了国内常见的两至三个字的简码,输入时只需键入o如名字的字音头即可;c、人名简码内设置了一些较有名的人的名字简码,输入时也只需键入i加相应名字的字音头即可;d、国名简码内设置了两字词的国名及其语言和名城的简码,输入时也只需键入u加相应名称的字音头即可;e、单位简码内设置了常见的一至三字计量单位的简码,输入时也只需键入v键加该单位名称的字音头即可;(四)对已编码好了的字或词组依照其编码符号的顺序,按下键盘中的相应符号键就能输入字或词组。
2.一种计算机符号的输入方法,其特征是a、对以下符号进行重新命名 b、对上述重新命名过的国标符号其编码规则是该符号名称的字音头的组合,但名称为一个字的符号除外,其编码规则为该字汉语拼音的前四个字母;c、对已编码好了的符号,只需依照该编码符号的顺序,依次按下键盘中相应的符号键就可输入该符号。
全文摘要
本发明提供了一种形音结合的计算机汉字及符号的输入方法,其特征是根据汉字的具体结构进行划分,并对汉字的笔画和偏旁进行重新命名,用汉语拼音的拼音标准对各部分进行编码,本发明具有规则简单、字汇量多、重码少等特点。
文档编号G06F3/023GK1296213SQ9912451
公开日2001年5月23日 申请日期1999年11月10日 优先权日1999年11月10日
发明者王源财 申请人:王源财
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1