五三音码及其键盘的制作方法

文档序号:6480130阅读:274来源:国知局
专利名称:五三音码及其键盘的制作方法
技术领域
本发明属于电脑汉字编码方法。是对本发明人前一项发明五三音码的补充和完善,因此仍称为五三音码。将来软件上市时改称三五音码。
在2001年3月5日的专利申请中,我因撰写经验不足,只说组字单元可以为任意个,最好与某种西文字母数相当,并没有说可以为10或20或30或40或50或60个甚至以上,可能会被人绕过专利,因此不得不重新提出申请。另外还引进了作了改进的一分为二合体字技术,形成了完整的五三音码体系。
本发明的目的是提供一种组合五三笔码和音码的电脑汉字编码方法五三音码。它具有几分钟学会,大部分汉字不必选择同音字,输入速度快的优点。采用调整方案的,也就是码长最多为2码的五三笔码为基础,组字部件为配合,汉字结构为补充并结合拼音的,甚至可以几乎不选同音字,从而实现高速脱稿输入,而学成时间仅需10来分钟。同时克服了其它任何编码都未能同时克服的二种主要缺陷或重码率过高,人工干预过多,无法提高输速;或规则繁杂,难学难记,不宜推广。对义部和余下部分分别按书写顺序以每三笔编码并结合拼音的五三音码或将合体字一分为二,对第1部分、第2部分分别按书写顺序以每三笔编码的五三音码也具有简单易记,重码少、输入速度快优点,只是规则稍微复杂点而已。
为达到五三音码的目的,规定五三笔码的码长最多为L,当超过规定码长时改取最后一码。也就是改取位于字尾的笔画的编码。当规定L较短,比如为2码或3码时,补上该汉字的拼音,这一技术虽然简单却取得了大部分汉字不必选择同音字的意想不到的良效。当规定五三笔码的码长最多为2码,以每三笔编码,为大大降低重码,对某些组字部件作了调整。调整时要避免容易出现在形部编码同一位置的组字频率高的组字部件和横竖斜某种排列组合形式排在同一键上,还要根据同音字的实际构成反复优选。排列时还要酌情考虑组字部件的笔画数,组字部件及横竖斜的27种排列组合形式的实用频率、键位压缩、指法规则等因素。所选用的基本组字部件可以为任意个,只要10来个就能非常有效地降低重码,此后边际递减,为二、三十个,与某种西文字母数大体接近时就能使重码率很低,有的组字部件还可以包含互为繁简、互相同源、音或形或义基本接近,主要为形体直观相似通常仅有个别笔画差异的同类组字部件。因基本组字部件与西文字母数接近,且基本按笔画或拼音或表形等方式排列所以极为简单;其余用横竖斜的27种排列组合离散,信息含量足,因此重码率很低,这就克服了其他任何编码都未能同时克服的2种主要缺陷。
由于汉字形体复杂,再加上键位压缩,单纯对首尾编码仍有点重码,为此可规定对少量组字部件可取其后三笔,其后不足三笔编码规则不变。同样遇到组字部件要优先按笔画数最多的组字部件编码。这一规则在输入大字符集汉字时十分有效。
个别汉字取首尾首次都不能取分同音字,这时可针对汉字的结构作调整,对重心字某一码要优先按重心所在编码;夹字架可去掉某一头后编码;对叠字架重叠部分可优选几个字母或其他符号作识别码;对组合组字单元优选几个字母或其它符号作识别码。
作为五三音码的一种变形,或者先对义部(部首)按笔画或拼音或表形等方式编码,按笔画编码指对义部以每三笔编码,通常取其首三笔,按拼音编码指取义部拼音声母,按表形编码指对义部与西文字母作类比编码,对余下部分也按书写顺序以每三笔编码,通常当义部在字首时第2码取字尾三笔,在字中时第2码取字首或字尾三笔,在字尾时取字首三笔。不足三笔取剩下的第1笔或第2笔。再与拼音组合。作为对五三音码的另一种变形,将合体字一分为二,对第1部分、第2部分别以每三笔编码,通常各取第1部分或第2部分的首三笔或末三笔。不足三笔可取剩下的第1笔或最末笔。再与拼音组合。在对三笔编码时遇到组字部件也要优先按最笔画数最多的组字部件编码。
下面结合多个优选的实施例作详细说明。
由于本发明为五三笔码和音码的组合发明,所以最好先掌握五三笔码的编码规则。将汉字的各种笔画归类为横竖撇捺折,其中点作捺,竖钩作竖,提作横,但点提相连时提做点。因为撇捺都由上向下倾斜,故归类为斜笔画。而折根据其没折、弯、钩前的运笔方向可分别并入横、竖、斜三类笔画中,这三类笔画本发明人称之为根本笔画。它与汉字各种笔画的对应关系见

图1所示。顺便指出所有图中的1、2、3都分别为横、竖、斜的代号。还要指出这种归类方法的要点是将撇捺并入斜笔画,而折因为组字频率低,如何并入横竖斜三类笔画中并不怎么重要。比如可将折分为弯、拐。弯指由左至右向下弯,如“口”字的第二笔等笔画。拐指从上到下向右拐,如“七”字第二笔等笔画。在将弯、拐分别并入横、斜中。也可将折分为横折、竖折、复折,再分别并入横、竖、斜三类笔画中。甚至可以将所有的折类笔画都并入竖类笔画中。这些都是该领域普通专业技术人员的变形,不影响本发明的实质。接着编码,规则是(1)对1至4笔的汉字将其具体笔画归类后按书写顺序根据笔画的相交情况编码。
(2)对5笔及以上的汉字按书写顺序以每三笔编码。在依次出现的三个笔画中,横竖斜的排列组合不外乎27种,可一一对应地排在26个英文字母及某个特定的符号键上,一般为标点符号键,如果系统允许的话,也可排在其它任何一个被指定的键上,甚至在标准键盘上新增一个键。为便于输入汉字用26个字母及“;”键编码。见图2所示。
应当指出,横竖斜三类笔画都是抽象概念,只要考虑书写顺序,不必考虑散、连、交三种空间关系。将任何三个笔画归类为横竖斜后依次排列,其三三组合都不外乎27种。某几种横竖斜的排列组合组字频率低,可将其合并排在同一键上,这样27种横竖斜排列组合可合并排在不足27个字母或别的符号键上,但这记忆不方便,一般还是一一对应为好。上述规则是以4笔为界的,其实也可以以N笔为界,还可以规定码长为L,当超过规定时可不对其后的笔画编码,也可规定改取最后笔画的编码,N、L均为正整数。当规定码长较短时,不上该汉字的拼音,构成五三音码。音码可前可后,一经选定不得改变,在编码实例中规定音码在先。下面时规定五三音码形部编码码长最多为2码或3码时的编码规则(1)1笔的汉字,横、竖、撇、捺、折的编码分别为五个互不相同的符号,比如1、2、3、4、5;(2)2~5笔的汉字取其首一笔或末一笔,横、竖、撇、捺、折的编码分别为五个互不相同的符号,比如1、2、3、4、5。
(3)对6笔及以上的汉字取其首三笔或末三笔,对首三笔或末三笔只需根据其横竖斜的排列组合情况以对应的字母或别的符号编码。
(4)对1~5笔的汉字或者以每三笔编码,对每三笔只需根据其横竖斜的排列组合情况按对应的字母或别的符号编码。若不足三笔,可将剩下的最末笔归类为几种笔画,用几个符号编码,也可将剩下的最末笔改为剩下的第1笔,还可考虑剩下的笔画数,当剩下二笔时,编码为别的几个互不相同的符号。一般将最末笔归类为横、竖、撇、捺、折用1、2、3、4、5编码,也可用其声母H、S、P、N、Z编码,在所有编码实例中用F、G、H、V、B编码,因为排在其键上的横竖斜排列组合,在字尾组字频率较低。
(5)对6笔及以上的汉字或者按书写顺序先对头三笔和次三笔编码。若剩下不足三笔,对剩下的笔画参照规则(4)处理;若剩下三笔及以上可取剩下的前三笔或末三笔。对头三笔、次三笔、剩下的前三笔或末三笔只需根据其横竖斜的排列组合情况以对应的字母或别的符号编码。
规则(1)~(4)都是以6笔为界编码,其实也可以以3笔及以上的任意笔画数为界。比如以4笔为界,对4笔及以上的汉字不顾已经编码过一律取其首三笔或末三笔,对1笔或2笔的汉字可直接用拼音编码。这样完全舍弃了剩下的笔画,但会增加点重码。音码可以为全拼或简拼或双拼或混拼或不完整拼音。为缩短码长,在实施例中采用双拼,并选用微软双拼,见图3所示。当然也可用别的双拼,包括自定义双拼。
因规则(4)包含规则(1),规则(2)要区分笔画数,规则(5)码长稍长,所以在实施例中按规则(3)、(4)编码。编码实例一(Y1F)种(VSJA)电(DMRB)脑(NKUO)汉(HJ;V)字(ZIKE)编(BMKS)码(MADW)方(FHMB)法(FA;C)五(WUWF)三(SJQ)音(YNMQ)码(MADW)以“种”为例,其双拼为VS,其首三笔为斜横竖,按图2编码为J,末三笔为横横竖,编码为A,“种”的编码为VSJA。又如“五”,双拼为WU,首三笔为横竖横,编码为W,最后一笔为横,编码为F,“五”的编码就为WUWF。
如果采用简码和去重键,绝大部分汉字都不必选择同音字,其它输入法都是按字频区分简码,那些字组字频率高,用户往往区分不清,本发明按笔画数多少区分,笔画数少的优先采用简码和去重键,去重键指将形部编码第2码用不参与编码的符号代替,如“,”键。不过要记忆那些是简码,那些可用去重键会增加记忆负担,力求全码输入时无重码才是上策,五三音码采用二三十个组字部件就能做到重码低,见本发明人在先申请所示,已经公开。当时我为防止他人绕过专利,面面俱到了点,许多约定只能降低一对重码几乎无用,如规定车、禾部应位于字首,力、刀约定在下部时书写顺序为撇折,艹下面连横时编码为廿的声母N等等。不必记忆,系统会给出兼容码。所采用的组字部件可以为任意个比如为10、20、30、40、50、60、70、80、90、100个及以上,下面给出组字部件为十余个的编码方案。
有些经常出现在字首或字尾的汉字组字频率高,若完全按规则(3)、(4)编码,容易几种排在某一字母或其它符号键上,这会造成一定数量的重码,因此有必要作适当的调整,调整的方法是将这些组字部件从组字频率高的某几种横竖斜排列组合上抽出,排列到组字频率低的横竖斜排列组合形式上,排列时还要考虑同音字的实际构成,还可酌情考虑组字部件和横竖斜27种排列组合的实用频率、键位压缩、指法规则,组字部件也可排在不属于27个字母或符号键上。将十余个组字部件排在键上的方式见图4所示,图4还调整了横竖斜27种排列组合形式在键盘上的布局,下面作具体解说(1)“竖横横”中的口、日、目、足、虫惯常出现在字首,组字频率都很高,将日、足、虫抽出分别排到竖斜竖B、横横斜E、竖竖斜H键上,口还惯出现在字尾,排到字首字尾组字都频率低的斜竖竖O键上。“横竖横”中的扌、土组字频率较高,扌排到字首组字频率较低的F键上,土排到组字频率较低的T键上。扌还可包含“奉”的末三笔,共同的特征是二横交一竖。“斜横斜”中的疒、竹惯常出现在字首,将疒排到字首组字频率较低的N上。“竖斜斜”中的小、及“衣”的末三笔在字尾的组字频率较高,分别排到字尾组字频率较低的H、斜斜竖L键上。“横斜斜”中的大、“六”的末三笔、“文”的末三笔在字尾的组字频率较高,将其分别排到字尾组字频率较低的S、U、K键上。氵、火在字首的组字频率较高,将氵排到C键上,女、纟在字首的组字频率较高,将女排到Z键上。为直观起见,将讠、亻字首组字频率较低的I、P键上。
(2)虫、小的首末笔为竖斜,兼容在H上。疒的末三笔为斜斜,兼容在N上。大起笔为横,兼容在S上。亻为斜竖,兼容在P上。女起笔为横斜,兼容在Z上。氵、土按声母C、T排列。口象O、日象B、足的中部象E、扌象F、钅字头象V、“衣”的末三笔中的竖提象L、“六”的末三笔向上旋转后象U、“文”的末三笔旋转后象K、讠象I,所以排在相应的键上。
(3)亻含人、氵含水、钅含金。除横斜斜中的大、“六”的末三笔、“文”的末三笔中的横笔画两端可一连其它笔画外,其它组字部件中的横笔画两端一律不得与其它笔画相连。
下面是按规则(3)、(4)及图4编码的编码实例一(YIF)种(VSJW)电(DMBB)脑(NKUO)汉(HJCV)字(ZIKZ)编(BMKS)码(MAXA)方(FHMB)法(FACC)五(WUAF)三(SJQ)音(YNMB)码(MAXA)以“电”字为例,双拼为DM,前三笔遇到日,编码为B,最后一笔为折,编码为B。电的编码就为DMBB。
汉字在其漫长的发展过程中形成了微妙的比数制,总的来看左右型的合体字大大多于上下型的合体字,上下型合体字又多于包围型合体字。许多输入法将这三种字型平等对待,用同样多的识别码去识别不大合理。部首又往往位于字首,不利于键位压缩,容易造成几个部首集中排在一个键上的情况,带来重码。有的输入法将部首拆分以区别重码,让许多人不习惯,有的输入法无视这一规律仅仅采用十个甚至更少的部首,结果造成大量的重码,要人们去记其简码,表面的记忆因素少,实际的记忆量很大。从五三音码十余个组字部件就能使重码低,二、三十个组字部件就能使重码很低,再增加组字部件就很再难降低重码的边际降重递减规律看,采用二、三十个组字部件是最合理的。采用大字符集汉字时由于字符多,部首又容易集中在字首的情况,最好规定取某些组字部件书写顺序后的次三笔,不足三笔仍按原先编码。结合汉字字型考虑,可规定上下结构或包围结构、处于字首的组字部件可取其后次三笔。只有一、二笔的部首往往难以区分部首,三笔及以上的部首往往与其余部分泾渭分明的间隙,一看就知是部首。结合笔画数与汉字字型考虑,可规定三笔及以上的上下结构或包围结构的部首取其后的次三笔。也可规定笔画数较多的左右结构处于字首的部首取其后次三笔,比如5笔或6笔或以上的左右结构处于字首的部首可规定取其书写顺序后的三笔。如果采用这一规定那么按图4编码在输入国标6763个汉字时能使重码较低。
有的汉字为左中右结构或上中下结构,两头组字部件又完全相同,形似架着一个组字部件,称为夹字架,对架字夹可去掉字首或字尾后的组字部件取其首三笔或末三笔编码。按图4,弼的编码为BIWB。
与载类似的汉字重心在车处,与赢类似的汉字重心在贝处,第二码要按重心所在编码。按图4,“赢”的编码Y;JC。
有的汉字为上下结构,并且至少有2个相同的组字部件依次出现在字尾,称为叠字架。若有二个相同的组字部件,形部第2码取优选的英文字母A,若有三个相同的组字部件,去优选的字母B。仍按图4编码,荔的编码为LISB。
作为五三音码的一种变形,对汉字形部编码或者按笔画或拼音或表形等方式先对义部(部首)编码,在对余下部分按书写顺序以每三笔编码。所说的对义部按拼音编码是指取义部的声母,参照自然码。所说的对义部按表形编码是指对义部与西文字母类比,参照表形码。所说的按笔画编码是指按照五三笔码以每三笔编码。对余下部分也按书写顺序以每三笔所都音的字母或别的符号编码。见图2。当不足三笔时取剩下的第一笔或第二笔,规则与五三笔码完全相同。为缩短码长,可规定义部和余下部分各取1码,一般当义部在字首时,第2码取字尾三笔。义部在字中时,第2码约定取字首或字尾三笔。义部在字尾时,取字首三笔。同样也可以象前述方法那样将组字部件排在键上,优先取码。参照图4。组字部件可以为二三十个甚至更多。也可以象前述方法那样取某些组字部件后的三笔。由于部首数量划分不一,位置不易确定。相比之下前一方案为优选。
作为五三笔码的另一种变形,形部编码或者将合体字一分为二。对第1部分、第2部分分别按书写顺序以每三笔对应的字母或别的符号编码,与五三笔码完全相同。见图2。将合体字一分为二的方法是根据汉字的整体结构,在最初产生缝隙处将合体字一分为二,对形声字当形部在字首或字尾时,应当以形部为界将合体字一分为二。比如“暮”字,尽管其部首为艹,但形部却为日,所以要按形部与声部交界处拆分。为缩短码长,一般第1部分或第2部分各取一码。可取第1部分或第2部分的首三笔或末三笔。不足三笔可取剩下的第1笔或最末笔。同样也可按前述方法将某些组字部件排在键上优先取码,为十多个组字部件时参照图4。组字部件可以为二三十个甚至更多。尽管绝大多数汉字一看就知是单体字或合体字,但也有些字难以区分是合体字还是单体字,或虽是合体字却不易拆分。相比之下仍以前一方案为优选。
本编码字词兼容,不必进行换挡等附加操作,重码低,重码的选择方法与其它输入法相同,或字频或智能或笔画数。“?”键为万能查询键。不足规定码长的均以空格键结尾。
本编码还提供了一种新的汉字修改方法。它使得汉字修改和西文差不多容易。方法是将光标移至所要修改的字,选定它,若该字读音与改后的字相同,击改后的字的五三音码或变形五三音码形部编码,改后的字即上屏。当然这需要强大的软件支持。本方法显然是用于语句语音输入后的修改,如果软件允许的话,只需念形部编码的读音。
本发明可以适用于一切巨、大、中、小、微型计算机中文信息处理系统和通信系统,,可广泛应用于中文终端、中文电传、电脑打字、计算机排版印刷等各个方面。可以在互联网环境下运行。
本发明可以适用于繁体字的港、澳、台地区,也可以用于日文、韩文,只是日文、韩文汉字与普通话读音不同,组字单元的排列不完全相同,排列方法仍然相同。
五三音码编码规则极为简单、客观,音码部份以双拼法为最快,对于已经掌握双拼法的人来说,不出短短十分钟就能学会,而且学会后就能牢记不忘,没掌握双拼法的人可在练习双拼法时同步学会。单字码长最长不过四码,重码率几乎为0,免去了同音字选择烦恼,音码部分选用南方模糊音几乎不会增加重码,南方模糊音的特点是c、s、z与ch、sh、zh,及in与ing不分,en、eng与清辅音b、p、m、f相拼时区分。支持语句输入,不易疲劳。容量大,从理论上讲可以容纳全部6万多个汉字,做到高速脱稿输入,也就是说不仅适合于盲打,还适合于听打、想打,使得汉字无论是输入速度还是调出速度都要快于西文。
权利要求
1.一种五三音码,其特征是组合五三笔码和音码,并以横竖斜的排列组合不外乎27种,可一一对应或大致一一对应排在27个或不足27个互不相同的字母或别的符号键上为基础,允许将汉字分为义部、余部或按书写顺序将合体字一分为二、调整某些组字部件包括笔画、若干特定结构的汉字的归类编排取码方法的编码。
2.一种五三音码形部编码键盘排列图,其特征是横竖斜的排列组合不外乎27种,一一对应或大致一一对应地排在27个或不足27个互不相同的字母或别的符号键上,允许把某些组字部件排在键上,组字单元可以为任意个,可以为10、20、30、40、50、60、70、80、90、100个及以上。
3.根据权利要求1所述的五三音码,其形部编码特征是对1~5笔的汉字主要按书写顺序根据每三笔的横竖斜排列组合情况以对应的字母或别的符号编码;
4.根据权利要求1所述的五三音码,其形部编码特征是对6笔及以上的汉字根据首三笔或末三笔的横竖斜排列组合情况以对应的字母或别的符号编码。
5.根据权利要求1所述的五三音码,其形部编码特征是有的组字部件还可以取其书写顺序后的三笔。
6.根据权利要求5所述的五三音码,其形部编码特征是选定组字部件,一般要考虑组字部件的笔画数或汉字整体结构字型。
7.根据权利要求1所述的五三音码,其形部编码特征是对汉字的义部和余下的部分分别按书写顺序主要以按书写顺序以每三笔对应的字母或别的符号编码,一般对义部和余下的部分各取一码。
8.根据权利要求1所述的五三音码,其形部编码特征是将合体字一为分二,对第1部分、第2部分分别主要按书写顺序以每三笔对应的字母或别的符号编码,一般对第1部分、第2部分各取1码
9.根据权利要求8所述的五三音码,其形部编码特征是对形部处于字首或字尾的形声字要在形部和声部交界处将其一分为二。
10.根据权利要求1或2或3或4或5或6或7或8或9所述的五三音码,其形部编码特征是若遇到排在键上的组字部件要优先按笔画数最多的组字部件编码。
全文摘要
本发明五三音码提供一种组合五三笔码和音码的电脑汉字编码输入方法,它具有几分钟学会、大部分汉字不必选择同音字、输速快的优点。采用调整方案就是采用以码长最多为2码的五三笔码为基础,组字单元为配合,汉字结构为补充并结合拼音,甚至可以几乎不选同音字,从而实现高速脱稿输入,而学成时间仅需10多分钟。
文档编号G06F3/023GK1435746SQ02102628
公开日2003年8月13日 申请日期2002年1月28日 优先权日2002年1月28日
发明者王治阳 申请人:王治阳
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1