综合性汉字编码法及键盘的制作方法

文档序号:6407953阅读:481来源:国知局

专利名称::综合性汉字编码法及键盘的制作方法
技术领域
:本发明属于计算计汉字处理系统的汉字编码方法及键盘设计。目前,我国在计算机的汉字处理方面,有拼音码和拼形码两种基本方法。在应用上,两种方法结合起来,相辅相承地解决了一、二级汉字的输入问题。但是,就目前已上机实用的拼音码看,都无法较系统地解决以下问题1.同音字问题。同音字不能妥善解决,无法与汉字一一对应,在同音字较多的情况下,只能“翻页”查寻,影响输入效率。2.声调问题。读音不准往往是声调问题,没有声调的编码无法反应出拼音码的基本形象。3.语词问题。有些单音节词(人们习惯称做字)与双音节词在判别时易发生混乱。如piao-皮袄、飘;xian-西安、鲜;dangan-档案、单干等。4.字符串过长与盲打的问题。现行的方案一个字的静频率一般在三、四键甚至更多,仍无法与汉字一一对应,实现盲打。5.在同一输入方式下的多码兼容问题。多种编码方法不是在同一编码思想指导下共存并用,就不能有效地降低操作人员的劳动强度和记忆量,难以提高工作效率。6.重码及汉字容纳量问题。在“GB”一、二级汉字的范围内就无法从根本上消除重码的方案,很难说能容纳我国所有的汉字。以上六项,有些方案虽能解决其中的两项或三项,但无法从根本上全面系统地解决;因此,现行方案只解决了计算机的当前应用问题,并没有解决计算机的汉字处理问题,且无法使汉字处理和语言处理实现统一。本发明的目的就是解决计算机在汉字处理方面存在的上述问题。它是在对上述诸问题进行综合分析的基础上设计的。可读、可写、可会意,希望它能为汉字改革和汉字与语言的综合处理提供条件。本发明的目的是这样实现的它选用26个拉丁字母和14个数字、符号做字符,便于计算机的应用,且与国际通用的文字书写形式一致,从而确立了计算机键盘的通用性。本方案的双拼码是在《汉语拼音方案》的基础上设计的,它是新文字码的基础。语词码是以双拼码为基础设计的,它是以词、词组、短语等为一个输入组合的编码。形码是以汉字的形体部件为基础进行拆分组合的码。它是拼音码的辅助,也是新文字码中辅助形符字中表形的基础。新文字码是与汉字一一对应的可以实现盲打的编码。它是在双拼码和形码的基础上设计的,它是我设计的拼音文字的变形码。现分述如下(一)双拼码双拼码是以《汉语拼音方案》为基础设计的。他包括十三个声符(和十三个辅助声符),十三个韵符(和十三个辅助韵符)。十三个声符是b、p、m、f、d、t、n、l、g、k、h、j、q,十三个韵符是x、a、o、e、r、i、v、u、w、z、c、s、y。用韵符做声符时,这些韵符叫“辅助声符”,用声符做韵符时,这些声符叫“辅助韵符”。(本文在“〔…〕”中和注明“读音”的字符组合均按《汉语拼音方案》的规定拼读。)声符和韵符的读音情况见下面的《声符表》和《韵符表》。声符表</tables>说明读音组合中的A、I、U、V分别表示开口呼、齐齿呼、合口呼和撮口呼中的韵符读音韵符表</tables>说明1.括号中的数字、符号为简音节中的韵符。2.表中与《汉语拼音方案-韵母表》读音一致的和用大写字符组合的读音为基本读音,小写字符组合的读音为辅助读音。3.表中的韵符“R”在四呼中的读音均为基本读音。此外,声符中的“B”、“P”、“M”、“F”与韵符“R”组合时读〔BU〕、〔PU〕、〔MU〕、〔FU〕,属基本读音。声符在键盘上的位置见《附图一--双拼码声符键盘》《附图一》中每一个键位的第一个读音是与韵符组合的读音,第二个读音是与辅助韵符组合的读音。读音中的韵符,“A”表示开口呼,“I”表示齐齿呼,“U”表示合口呼,“V”表示撮口呼。韵符在键盘上的位置见《附图二--双拼码韵符表》《附图二》中每一个键位的第一个组合为开口呼或齐齿呼的读音,第二个读音为撮口呼或合口呼的读音。声符与韵符组合后的读音情况见下表--《声符、韵符拼读表》声符、韵符拼读表(声符、辅助声符与辅助韵符组合的读音)--BPMFDTNLGKHJQB.biabianbiebibibibiaobianbinbingbingbingP.piapianpiepipipipiaopianpinpingpingpingM.miamianmiemimimimiaomiumianminmingmingmingJ.jiajianjiejijijijiaojiujianjinjiangjingjieQ.qiaqianqieqiqiqiqiaoqiuqianqinqiangqingqieX.xiaxianxiexixixixiaoxiuxianxinxiangxingxieI.diadiandiedidididiaodiudiandingdingV.tiatiantietitititiaotiutiantingtingU.nianiannieninininiaoniunianninniangningningW.lialianlielilililiaoliulianlinlianglinglingY.yayanyeyiyiyiyaoyouyanyinyangyingyingF.wawowowuwaiweiwuwuwanwenwangwengweiD.duanduoduodudunduidududuandundongdongduiT.tuantuotuotutuntuitututuantuntongtongtuiN.nuannuonuonununnuinununuannunnongnongnuiL.luanluoluolulunluilululuanlunlonglongluiG.guaguoguoguguaiguiguguguangunguanggongguiK.kuakuokuokukuaikuikukukuankunkuangkongkuiH.huahuohuohuhuaihuihuhuhuanhunhuanghonghuiA.zhuazhuozhuozhuzhuaizhuizhuzhuzhuanzhunzhuangzhongzhuiO.chuachuochuochuchuaichuichuchuchuanchunchuangchongchuiE.shuashuoshuoshushuaishuishushushuanshunshuangshongshuiR.ruoruoruruirururuanrunruangrongruiZ.zuanzuozuozuzunzuizuzuzuanzunzongzongzuiC.cuancuocuocucuncuicucucuancuncongcongcuiS.suansuosuosusunsuisususuansunsongsongsui(声符、辅助声符与韵符组合的读音)--XAOERIVUWZCSYB.bubabobobubaibeibaoboubanbenbangbengP.pupapopopupaipeipaopoupanpenpangpengM.mumamomomumaimeimaomoumanmenmangmengF.fufafofufufufeifoufanfenfangfengD.daodadandededaideidsodoudandendangdengT.taotatantetetaiteitaotoutantangtengN.naonanannenenaineinaonounannennangnengL.laolalanlelelaileilaoloulanlenlanglengG.gaogagangegegaigeigaogougangenganggengK.kaokakankekekaikeikaokoukankenkangkengH.haohahahhehehaiheihaohoubanhenhanghengA.zhizhazhizhezhizhaizheizhaozhouzhanzhenzhangzhengO.chichachichechichaicheichaochouchanchenchangchengE.shishashisheshishaisheishaoshoushanshenshangshengR.ririreriyaoyouranrenrangrengZ.zizazizezizaizeizaozouzanzenzangzengC.cicacicecicaiceicaocoucancencangcengS.sisasisesisaiseisaosousansensangsengI.eaoeeraieiaoouanenangengV.vvevevevvvvanvenvanvenvongvongJ.jujuejujuejujujujuanjunjuanjunjiongjiongQ.ququeququeququququanqunquanqunqiongqiongX.xuxuexuxuexuxuxuxuanxunxuanxunxiongxiongU.nvnvenvnvenunvnvW.mvlvlvelvelvlvlvY.yiyayoyeyiyiyiyaoyouyanyinyangyiong在同音字较多的情况下,可以采用“声部介入法”把同音字按声部分成若干类,然后按辅助读音组合输入部分声部相同的同音字。如〔KU〕音节有三种组合方式。可把本音节用“声部介入法”分成三组一.KF-哭、枯、苦、骷、刳、绔,二.KN-酷、喾、堀、窟,三.KL-库、裤。其中第一组为基本读音,其他为辅助读音。另外,本编码设计了一键字14个,二键字350多个(本编码所说的几键字是指几键进入光标位置的字)。详见“新文字码”。本说明《双拼码表》从略。(二)拼形码在本系统中,形码是拼音码的辅助码。一方面,它帮助输入只识形不识音的生僻汉字;另一方面,它是新文字码的辅助码元。它选用26个字母做字符,根据各部件(本方案中,组成汉字的偏旁、部首、笔画及常见的独体结构统称为“部件”)在表形、达义及在组合中的笔画情况,把部件分成25类,分别用25个字符表示;为使用方便,再把每类分成两组。形符与部件的对应关系见《形符、部件对应表》。形符、部件对应表一组(形、义为主)-------二组(按笔划分)---------B.金刀比匕釜召一二三元开亏钅刂BY.干于无非韦夫井专春击戋盏P.木本未末束柬五PY.丁工才求亚世疋甫其丐曹惠M.水川百万氵MY.不存有而歹尤在友夏丌兀尢F.火皿臼缶瓦弓戈矛矢武戊弗灬FY.平夹十支直真古克孛丧蔷D.土丰耒农田由申甲电老七DY.互与屯弋至尧夷区巨臣匚T.日曰黑白赤朱乌黄丹青色采TY.卤凸占点卢卣贞卓叔睿餐卡顷丨攴N.月祭雨天气云辰午夕夜年风几NY.业临竖坚鉴监紧览贤肾L.玉王文贝页书册齐章表敖夂攵LY.师帅归千壬乖乘秉垂熏G.山穴东西南北方向正票宀冖GY.卜光以党当尚赏堂肖敝K.石里上下左右内中央阝卩KY.用同周且四凹曲串甩禺具冈冂H.花草荣共劳莫廿卅艹廾HY.乔升夭制欠尔乍卸每舞丿乇J.车舟广厂大小长丈尺寸度庸JY.片丘禹卯奥囱囟阜留卑鬼段延Q.衣巾革系堇皮毛布丝糸纟衤QY.后厅反质所殷盾卮彡X.食米豆谷面斤两重饣XY.八公分个乎兆乏凶爻A.竹禾瓜果麻生发酉冷将冫丬AY.九勿句包刍象角乐久免争奂危勹殳O.马牛犬鹿虎鼠豕畜兽六豸虍犭OY.主交产亦旁玄亡亥市离商丶亠E.虫鸟鱼羽龙隹龟岛燕雁凫EY.门问闲间京高享亮襄禀毫哀R.人入我自父会合今令全仓仑亻RY.州义丫I.女母毋儿子士氏亲妻孑孓鼓IY.斗兴学关兼并半单曾卷兹益弟酋V.口口齿牙舌只因固VY.之户必良永扁郎U.言音示辛甘隶肃聿尹事讠礻肀UY.乙艮既刁爿那司录W.目见耳鼻头首眉病取聚巴疒WY.了也收疏函承丞亟丑卫屮Z.心身骨肉脊血尸己已巳民辟忄ZY.力办挖乃及C.手爪爱折执更吏史曳扌CY.又圣习劲参癸台允予甬登飞厶S.足走立止来去步行跑出回坐迅辶廴SY.乜乡幻幼彝甾彖幽巛幺Y.○,。、;?!“”《》…YY.(图形字符区)使用说明1.凡本表中未列出的部件一律按笔画处理。按笔画取码只取部件的前两笔。2.单部件的汉字,用其表示类、组的码直接输入。如金--B、木--P、春--BY。3.双部件及三部件组合的汉字,按其书写顺序直接输入该部件的码。如钊--BB、淋--MPP。可以把取件规律编成一组口诀。即剖析整体按序编,兼用前移大优先;表中无件按划选,前多后少两取边;左中右形靠上取,上下结构取中间。如“暗”两部件取“日、音”,而不取三部件“日、立、日”(大优先)。对于有四个及以上的部件组成的汉字,要按其取件规律取其二码或三码。如“乾”取“十、十、(撇横)”(前多后少两取边,靠上取,按划选)。“赢”取“亡、口、女”(上下结构取中间)。在超过两部件的组合中,如果出现独立的一笔划,要舍去。如“桓”应取“木、曰”,“胤”应取“幺、月”。各形符、部件在键盘上的位置见《附图三--形符键盘》。《附图三》中每个键位表示的部件仅仅是举例。上行表示形、义部件,下行表示笔画部件。本说明《形码码表》从略。(三)语词码语词码是根据人们使用拼音的书写习惯在双拼码的基础上为提高输入速度编制的。它规定两字词按其音序直接输入每个字的双拼码,组成最高四码。三字词按其音序直接输入每个字的声符组成三码。如“分水岭”--“FEL”四字词按其音序直接输入每个字的声符组成四码。如“信息处理”--“XXOL”。超过四个汉字的词叫多音节词(包括词组和短语)。要采用“单词分割法”输入。其方法是把多音节词分割成四个或四个以内的单词(或较小的词组),然后取其每一个词的第一个字的声符组成三码或四码。如“中国科学技术协会”分割成“中国-科学-技术-学会”,编码为“AKJX”。也可把分割出来的词分别单独处理。由于在新文字码中,使用频率高、组词能力强的多是一键字、两键字,故在应用中只要不是用“单词分割法”紧缩的语词,一般可以用新文字码直接输入。本说明《语词码表》从略。(四)新文字码新文字码是在拼音码和拼形码的基础上编制的,它是我的《拼音汉字方案》的基础。新文字码每字有1--4个字符组成。由一个字符组成的叫“单字符字”,其中的字符是用调符充当,在这里叫“代字符”;由两个字符组成的叫“简音节字”,其中第二个字符是韵符,韵符也用调符充当,在这里叫“代韵符”;三个字符组成的叫“全音节字”,其中第三个字符是“调符”;四个字符组成的叫“形符字”。编码规定编码的第一个字符是声符,第二个字符是韵符,第三个字符是“调符”(表示声调的字符);如果加入形符,第三个字符是形符,第四个是调符。声符和韵符同双拼码的声符和韵符;形符同形码的形符,但要把按笔顺取码改为从表形、表义的角度取码。如“鸡”要取“鸟”的码,不取“又”的码。调符由14个数字、符号键代替,在本方案中起三个作用一是在单字符字中代汉字,在简音节字中代韵符;二是标调作用;三是使该字进入光标位置。调符的使用情况见下表--“调符使用说明”。</tables>用新文字码输入汉字(只按单字方式输入)。如本说明《新文字码表》从略。新文字码不是我编的拼音汉字,但是,只要掌握了新文字码就基本上掌握了我的拼音汉字方案。本发明具有以下特点1.本方案采用40个键位,集双拼码、拼形码、语词码、新文字码于同一系统下,键盘操作方便。2.双拼码只用两个字符输入汉字,且有350多个最常用字可以用一键或两键进入光标位置,优于其他拼音码。只要具有初步拼音知识,就可以使用。3.形码是双拼码的辅助码,它采用26个字符代形,采用拆分汉字部件,按书写顺序组合的方式输入汉字,最多三码,便于掌握应用。4.语词码是在双拼码的基础上为提高输入速度而设计的。对三字、四字词采用只输入每个字的声符的方式输入,对多字词采用“单词分割法”输入。5.新文字码是编码与汉字一一对应的码。它是在双拼码的基础上引入表示声调的调符(必要时再附以形符)组合而成的。因此,在双拼码和形码的基础上,只要掌握了调符的有关规定,即可以使用。本发明通过上述处理,在同一设计理论下有条不紊地解决了双拼码、拼形码、语词码、新文字码的四码统一问题。尤其是新文字码,有效地解决了音码的同音字问题,实现了编码与汉字的一一对应。它不但读音准确,使编码密切依附于语言、密切依附于文字,而且缩短了字符串,提高了输入速度。用发展的眼光看,它将为利用计算机对我国的语言和文字的综合处理提供条件,对我国的文字改革工作将有着极深远的影响,使汉字处理最终从编码的笨拙方式中走出来。本发明的实施例已在上文中逐一给出。权利要求1.这是一种实用通用键盘中的26个字母和14个数字、符号做字符的综合性汉字编码法及键盘设计(在这里,40个字母、数字、符号统称为字符)。其特点是在同一输入系统下实现了双拼码、拼形码、新文字码、语词码,这四种编码的综合处理。2.按照权利要求“1”所说的双拼码,它是以《汉语拼音方案》为基础在拼音汉字的理论上设计的。其特征是由两个字符组成一个音节(一个字符亦可输入或提示常用字)。音节的第一个字符是声符(或辅助声符),第二个字符是韵符(或辅助韵符)。采用同音字提示的方式输入汉字。3.根据权利要求“2”所说,在同音字较多的情况下一是可以采用提示区翻页的方式查找所需汉字,二是采用“声部介入法”把同音字根据表音部件的不同分成若干类,用规定的其他双拼组合分别表示,以此消除提示区的翻页(详见说明书)。4.按照权利要求“1”所说的拼形码,它是双拼码的一种辅助编码。其特征是把组成汉字的部件(本方案把组成汉字的偏旁、部首、笔划等统称为部件)按意、形、笔划分成25类,分别用25个字符表示。为方便记忆,再把每类分成两组,第一组主要表示意和形,第二组主要表示笔划。5.根据权利要求“四”所说的拼形码部件分组情况见《形符、部件对应表》。其取码的方法是单部件的汉字由表示该部件的字符直接输入;二、三个部件组成的汉字,按笔顺取其二码或三码;三个部件以上的汉字,要按其规定取二码或三码(详见说明书)。6.按照权利要求“1”所说的语词码,其特征是在双拼码的基础上增加若干规定,使两音节词直接输入每个音节的双拼码组成二码词、三码词或四码词,三音节词直接输入每个音节的声符组成三码词,四音节词直接输入每个音节的声符组成四码词。7.根据权利要求“4”所说的超过四个音节的词、词组或短语输入时,须采用“单词分割法”即把其分割成四组以内的单词或较小的词组,取其每组的第一个字符输入(详见说明书)。8.按照权利要求“1”所说的新文字码是与汉字一一对应的编码。他是在双拼码的基础上,在韵符的后面加上表示声调的调符组成一个全音节。其方法是用14个调符,其中一个表示变调常用字,一个表示轻声字,其他12个平均分成四组,分别表示音节的阴平、阳平、上声和去声(调符在计算机上用数字、符号键,在拼音汉字中另设字符)。一个全音节表示一个汉字,同音字较多的音节要分组,分组时仍采用“声部介入法”。9.根据权利要求“8”所说,在增加了调符后还不能达到汉字和编码一一对应时,在调符的前面要加入形符组成四键字(也叫形符字)。形符采用权利要求“4”所说的编码法,用时只取表示义、形、笔划等部件的码,表音的部件用于“声部介入法”。10.按照权利要求“8”所说的调符,在应用上同时起着使汉字输入到位的作用。它只能用在一个音节的后面,即如果它用在一个音节的第四键,该字是形符字,按下第四键该字进入光标位置;如果它用在一个音节的第三键,该字是全音节字,按下第三键,该字即进入光标位置;如果用在第二键,该字是简音节字(在简音节字中,调符表示读音,其方法见《韵符表》),按下第二键,该字进入光标位置。本编码所说的几键字,指几键输入到光标位置的字。本码还规定了14个常用字用调符表示,一键即可进入光标位置。另外,按照权利要求“1”所说的新文字码,还不是拼音文字。拼音文字是我设计本编码的思想基础和实践依据,也是设计本编码的出发点和归宿。全文摘要本发明属于计算机汉字处理系统中的一种综合性编码系统及键盘设计。它采用通用键盘中的40个符号键做码元,使双拼码、拼形码、新文字码、语词码,四种编码自成一套系统,码长为1-4码,实现了易学和快速的统一,适用于不同文化程度、不同专业的专职的或非专职的打字人员。该码密切依附于语言,密切依附于文字,在一定的规律下实现了编码与汉字的一一对应。并希望它能为汉字改革以及汉字与语音的统一处理提供条件。文档编号G06F3/023GK1163429SQ9411043公开日1997年10月29日申请日期1994年2月1日优先权日1994年2月1日发明者侯同胜申请人:侯同胜
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1