块声汉字输入法的制作方法

文档序号:6414532阅读:452来源:国知局
专利名称:块声汉字输入法的制作方法
块声汉字输入法,是以简明快捷的方法,将汉字输入电脑,其范畴属于电脑软件技术领域。采用这种方法,能很容易地使电子计算机适用于中文。在理解和审查时,现有汉字输入技术中可供参考的有(1)汉语拼音输入法;(2)五笔字型汉字输入法。
随着社会主义建设事业的发展和现代化科学技术的进步,电子计算机在我国国民经济和人民生活中已逐渐得到了较为广泛的应用,由于现时的电脑,只能以西文输入,若操作者没有西文基础,其应用范围会受到一定限制,在应用过程中也会发生许多困难。因此,汉字进入电脑,已成为当前迫切需要解决的一个重要问题,否则不仅影响我国电脑事业的发展,而且将影响汉字在国际上的地位。汉字编码,目前虽然已有多种方法,但真正能够普及实用的却很少,极须进一步努力探索创新,以适应国家建设和人民生活的需要。块声汉字输入法,是一种形象、直观、易学、好记的编码方法,这一方法的确立,对电脑应用和电脑事业的发展都具有积极意义。
(一)块声编码的基本原理
1、汉字笔画字块为编码基础汉字是笔画和字块组成的,所有汉字都有笔画,如横、竖、撇、捺等。但仅有笔画没有字块的独体汉字,只是很小一部分,绝大部分汉字是由字块组成的组合汉字。经过历史上长期发展变化,从象形字、形声字、音义字直到今天的简化汉字,虽有许多变化,但却始终没有脱离由笔画组成独体汉字,由字块组成组合汉字基本规律。独体汉字,笔画少的为一两画,笔画多的为十画左右,如″事″″肃″等。组合汉字,字块少的为一两个字块,字块多的为七个字块左右,如″李″″取″是由两个字块组成的,″燥″、″樊″是由五个字块组成的等。块声汉字输入法,是将独体汉字拆分为笔块,将组合汉字拆分为字块,按一定规则程序排列起来,对汉字进行编码。
2、汉语拼音字母为字块代码汉字拼音字母,是一种比较理想的编码符号。自一九五八年《汉语拼音方案》颁布施行以来,汉语拼音已在教学注音、报刊、商标等许多领域,得到了较为广泛的应用。汉语拼音字母也已逐渐为人们所熟悉。块声编码,是用汉语拼音的声母为代码与汉字的读音结合起来进行编码的,对任何一个汉字,只要呼出其声母,就已有了它的代码,例如″梧″字是由″木″、″五″、″口″三个字块组成的,只要呼出他们的声母(按块声编码规定,先呼出其整字声母,再依次呼出字块声母)wmwk,梧字的编码就完成了。这样,在看到任何一个汉字时,就像见到熟人一样,随即可以叫出他的名字,不需要花费时间去考虑它的区位码,笔形,也不必去思索它是属于哪个偏旁部首,属于什么字根了。(块声代码键盘位置图见说明书附

图1)。
块声编码,只用声母不用韵母,因为只要将字块的声母依次排列起来,就可以形成汉字编码了。汉语拼音字母中″a″、″o″、″e″三个韵母,在编码时只作字声,用于安、欧、恩等字的第一位代码。汉语拼音字母中的i和y,在编码时只用″i″作″衣″音,而″y″借作″儿″音。为减少重码,原来的复合字母″er″在编码时不用;汉语拼音字母中的w和u,在编码时只用″w″作″乌″音,而″u″借作″迂″音,代替原来的″ü″,以补充键盘上没有″ü″音字符的不足,″v″在汉语拼音中只用于拼写外来语少数民族语言和方言,在这里用作备用码,既能补充编码时代码的不足,又有利于发挥每个字母的作用。
3、字块与字声代码结合块声编码,顾名思义就是把字块和字声两个因素结合起来进行编码的,有了字块和字声,实现汉字编码就很容易了。在编码过程中,只要按照汉字和字块的书写顺序,先左后右,先上后下,先外后内,将代码排列起来,就已完成整体汉字的编码了,例如″纷″字,只要将纷、纟、八、刀几个字块的代码fsbd排列起来就可以了,这种编码方法,即使是初学的人,也能很容易学会的。
(二)编码方法
1、编码原则,每个汉字和字块(或笔画)的声母均作为一个代码,所有汉字,都可以根据笔画和字块的多少,由二位到四位代码组成编码,一个汉字最多不得超过四位代码。
2、编码要求(1)独体(无字块)汉字,用笔名声母编码,凡是拆不出字块的汉字,不论其笔画多少,都作为独体汉字。″夫″字是独体汉字,″重″字也是独体汉字。夫字的编码是fhhp(夫、横、横、撇)重字的编码是zphs(重、撇、横、竖)。(笔名代码对照表见说明书附图2)这里笔画″1″(折),包括右折和复折,例如″乙″字和″儿″字的第二笔画等。
(2)组合(有字块)汉字,用字块声母编码。编码顺序,整体汉字的声母为第一位代码,字块的声母依次排列为第二第三或第四位代码。最多不得超过四位代码。字块少的汉字,只用两位代码,例如″在″字仅有一个″土″字字块,其编码为zt;″机″字有″木″、″几″两个字块,要用三位代码,即jmj;,″培″字有″土″、″立″、″口″三个字块,要用四位代码,即ptlk。含有三个字块以上的汉字,其四位代码之后的多余字块舍弃不用,例如″藻″字有六个字块,在编码时只取前四位代码zcsk,后面的″口″、″口″、″木″三个字块均舍弃不用。
(3)词组编码,由第一个汉字和最末一个汉字各取前两位代码,组成词组编码。代码的排列顺序与单个汉字编码的排列顺序相同,即先整体后字块依次排列,每个词组不论字数多少,都用四位代码,中间部位和最末部位若有多余汉字或字块均舍取不用,例如″你好″的编码是nrhn;″社会主义″的编码是ssip。如果首末汉字是独体汉字,也是用笔名声母为代码,例如″中国″的编码是zsgk。
词组编码的汉字拆分,与单个汉字的拆分要求相同。在词组编码中为什么也要拆分汉字,因为大部分词组是由两个汉字组成的,如果只用整体汉字编码,很多词组仅有两位代码,必然会造成许多重码,采取首末汉字拆分的办法,就可以适当减少一些重码。而且由于这种词组编码方法,与单个汉字编码方法基本相同,对操作者来说,也比较容易掌握。
3、复合字母用前舍后。在汉语拼音字母中zh、ch、sh都是复合字母,因其复合位置固定不变,按一字四码要求,在汉字编码时,往往一个汉字仅能用两个复合字母,容易造成重码,例如竺与筝,饰与砷等,若采取用前舍后的办法,在编码中遇有复合字母时,只用前一位单字母而舍弃后一位单字母,情况就大不一样了,可以避免许多重码。
4、类似近似汉字的字块,视与正规汉字字块相同。在汉字的偏旁部首中,有不少字块与正规汉字有些不同,如亻、扌、艹等,这些字块都是类似近似汉字,在编码中对这些字块要看作与正规汉字字块相同,例如″亻″与人字块相同,″饣″与食字块相同。(类似近似汉字字块与汉字对照表见说明书附图3)还有少数非偏旁部首的类似近似汉字字块和个别在编码时较难区分的字块,也要按上述办法处理。缶、
都用″f″声;里、里都用″l″声;土、士都用″t″声;日曰都用″r″声,爿、丬都用″p″声。
(三)汉字拆分要求汉字拆分是编码写读的基础,操作者必须首先了解和熟悉汉字拆分要求,才能做到准确输入迅速读出。由于汉字结构比较复杂,一个汉字往往是笔画字块结合在一起的,有些较大的字块,还包容着较小的字块,有的笔画既可以作为笔画,也可以作为字块,如何正确地把字块拆分出来,是实现块声编码的重要环节。
1、拆分顺序从整体汉字中拆分字块(或笔画),其顺序与汉字书写顺序相同,按字块(或笔画)的先后顺序排列编码,例如″明″字,要将日的代码排在先,月的代码排在后;″程″字要按禾、口、王的顺序排列,若排列次序颠倒,就会造成误码无法存取了。
2、字块,凡能独立成为汉字(包括类似近似汉字),不论其笔画多少都称字块,″十″字是字块,″农″字也是字块,字块的多余笔画一般可以舍弃,但字块中若有多余交叉笔画或与交叉笔画直接相连的笔画又不能拆为另一字块的,则不能舍弃笔画取字,例如不能将″十″字舍弃竖笔取作″一″字块;不能将″木″字舍弃撇捺取作″十″字块;也不能将″土″字下端横笔舍弃取作″十″字块等,若仅有笔画不成汉字,不论笔画多少都只能称为笔画,不能用作字块,例如″春″字上部笔画,″寒″字中部笔画。
3、拆大取小,有的字块既可用作大字块又能拆为小字块,应尽量拆小,例如″孝″字,既可用作孝字块,也可拆为子字块,按取小原则拆为″子″字块。
4、偏旁部首不拆,在偏旁部首中有不少声母是相同的,若把″足″拆为口、卜、人,把″鱼″拆为刀、田、火,则与原有的这些偏旁部首相同,将会造成许多重码,但非偏旁部首的字块则可以拆分,对较难确定是否为偏旁部首的字块,可以采用兼容码的办法加以拆分。一个汉字只能有一个偏旁部首。
5、几个特定字块(1)″一″字字块,必须是全通横笔没有其他相连笔画,字块中的横笔,不能拆作″一″字字块,例如″旦″字下端的一横可以拆作″一″字字块,而上字下端的一横则不能拆作″一″字字块。横上有点的也作为相连笔画。
(2)整体方框字可以作″口″再拆,字块中的方框不能作″口″再拆,例如″圆″字可以拆作″口″、″口″、″贝″,而恩字上部的因和苗字下部的″田″则不能作″口″再拆。
(3)两横点作″八″,只限用于字的上端或下端,字块当中的两横点不能拆作″八″字字块,例如美字上端两横点可以拆作″八″字字块;黄字下端两横点也可以拆作″八″字字块,而立字中部的两横点则不能拆作″八″字字块。
(4)衣字在有些汉字中被分为上(亠)下(
)两部分,在拆分时仍作为″衣″字字块,例如″衰″、″襄″等字上下端的衣字,仍作为″衣″字字块。
块声汉字输入法有哪些优点(一)直观,对任何一个汉字,只要把字块(或笔画)的声母相加起来,编码就完成了。
(二)统一,不论独体汉字、组合汉字、词组的编码,都用块声输入一种方法,使操作者容易掌握。
(三)容量大,所有汉字不论简体繁体都能适应,不受字数限制。
(四)击键少,一个汉字只需击键二到四次,(不用简码),其中击键二、三次的约占30%,有利于提高输入效率。
实现本发明的最好方式,是组建专业软件生产单位或组织现有计算机生产厂,电脑软件生产厂实施产业化。
权利要求
1.块声汉字输入法,是以笔名、字块为基础,以汉语拼音字母为代码,对汉字进行编码,并形成完整系列。独体汉字、组合汉字、词组都统一使用块声输入方法。
2.独体汉字用笔名声母编码及10种笔名的代码。
3.组合汉字用字块声母编码,并按先整体后字块依次排列。
4.词组编码、第一个汉字与最末一个汉字,各取前两位代码,若有多余汉字字块(或笔画)均舍弃不用。
5.拆大取小,对既能用大,又能拆小的字块,尽量拆为最小字块。
6.用前舍后,对复合字母只用前位单字母,舍弃后位单字母,四码之后的笔画或字块均舍弃不用。
全文摘要
块声汉字输入法,是以简明快速的方法,将汉字输入电脑。属于电脑软件技术领域。其主要技术特征,是将独体汉字拆分为笔画,将组合汉字拆分为字块,以汉语拼音字母为代码,对汉字进行编码。每个汉字,根据字块(或笔画)多少,由二位到四位代码组成。一个汉字最多不得超过四位代码。独体(无字块)汉字以10种笔名声母为代码;组合(有字块)汉字以字块声母为代码;词组第一个汉字与最末一个汉字各取前两位代码,若有多余汉字字块(或笔画)均舍弃不用。块声汉字输入法,适用于所有汉字向电脑写入读出。
文档编号G06F3/023GK1248740SQ9812190
公开日2000年3月29日 申请日期1998年9月22日 优先权日1998年9月22日
发明者蒋琨, 蒋方明 申请人:蒋琨, 蒋方明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1