和码汉字数字输入法的第三种编码方法

文档序号:6335140阅读:323来源:国知局
专利名称:和码汉字数字输入法的第三种编码方法
技术领域
“和码汉字数字输入法”的第三种编码方法,属于汉字编码输入法技术领域,是适用于计算机,手机,电话机等设备的汉字键盘输入方法。
背景技术
汉字输入法是通过输入键盘的有限个键输入六千多个,甚至更多汉字的方法,其关键技术是对这么多汉字进行编码,通过一码或多码输入一个汉字或词组,每个码对应输入键盘上的一个键。对汉字不同的编码,就产生不同的汉字输入法。汉字输入法就其所使用的汉字信息的不同大致可分为三类形码,音码,形音结合码。
形码是以汉字字形,笔画和笔画构成的部件作为输入码输入汉字,汉字一字一形,形码与汉字最有可能构成有效的对应关系。由于汉字有大量的笔画和部件,汉字的构成又没有很好的规律性,如何选取和利用字型、笔画和部件进行编码,又有许多家的看法,这就形成了现有的多种汉字形码输入法。现有的汉字形码输入根据输入键盘的大小又可分为两类标准计算机键盘形码输入法,和数字键盘形码输入法。
许多输入法不能同时适用于标准计算机键盘和数字键盘,不能做到了同一输入法在两种键盘上的统一。
和码汉字数字输入法是25个码的纯形码数字输入法,是电脑大小键盘与手机统一通用的。和码也是由我(欧阳贵林)发明的。专利申请号是200410017084.6,已于2005年1月12日公布。和码输入法的第一种编码方法写在200410017084.6号专利中,其方法的主要内容是字码长为4,汉字分为左右型和其它型,左右型字在左部起笔位置,右部的起笔位置和右部的末笔位置各取一个最大码值的输入码,在剩余的笔画与部件中再取一个最大码值的码;其它型字在起笔位置和末笔位置各取一个最大码值的码,在剩余的笔画与部件中取最大码值和次大码值的码。
和码输入法的第二种编码方法,专利申请号200510025790.X,其方法的主要内容是将汉字区分为一分(整体)、二分、三分汉字等三类,单字最多取4个码,一分(整体型)汉字的编码方法是在汉字起笔位置的第一笔画及其后续笔画,取一个最大码值的笔画或部件码作为第一码,在余下的笔画与部件中(剩余部份),按各个笔画与部件码值的由大到小的顺序,取最大、次大、次次大码值的3个笔画或部件码,分别作为第二、三、四码;二分汉字的编码方法是在两个部分的起笔位置各取一个最大码值的笔画或部件码,按二个部份在汉字书写顺序中的位置先后,分别定为第一、二码,在剩余部份的笔画与部件中,按各个笔画与部件码值的由大到小的顺序,取最大、次大码值的2个笔画或部件码,分别作为第三、四码;三分汉字的编码方法是在三个部分的起笔位置各取一个最大码值的笔画或部件码,按三个部份在汉字书写顺序中的位置先后,分别定为第一、二、三码,在剩余部份的笔画与部件中,取一个最大码值的笔画或部件码作为第四码。

发明内容
一、和码汉字数字输入法的第三种编码方法的目的1、使单字的取码方法更科学、合理、自然、顺畅。
2、使和码汉字数字输入法中,单字的取码顺序更进一步地与汉字的书写顺序相同。
3、使单字编码最大程度地包涵汉字的字义与字结构信息。
二、和码汉字数字输入法的第三种编码方法的技术方案(一)、字根表第三种编码方法的25个数字输入码所含笔画与部件的选取与排布,是按照和码汉字数字输入法专利(200410017084.6)所述的方法进行的。
各数字码所含笔画与部件在5×5的矩阵格子中的纵横有序地排序,在横方向以横(包括提与横折)(横是与其它笔画相离或相接的横)、横(与其它笔画相交的横)、竖、撇、点(捺)为序,纵方向按笔画与部件对字义与字结构的限定性大小为序。第三种编码方法的码表如以下表1所示和码字根表 注41厶幺纟;32 45忄小。
(表1)各个码在矩阵格子中的行数与列数的组合,构成该码的码名与码值。如“丿”的码名(码值)是14;“艹”的码名(码值)是42;“月”是54。
(二)、单字的分块方法汉字的组成是从单笔画开始的,由单笔画构成简单字或字块如十、土、口、日、火、王、木、月、讠、阝、彐、尢、冖等等,再由简单字或字块,按相离与相接的关系组成复杂字(组合字)。如汉(氵又),字(宀子),结(纟土口),构(木勹厶)等等。
汉字中的绝大多数都是由两个、三个或多个简单字或字块,按相离或相接的关系,组合而成的。
和码对单字的分块,是指把单字按组成结构的“相离可分,相接有条件地分,相交不分”规则,分为三块字、二块字、一块字(整形字)。最多分为三块。
分块规则有三条,具体内容如下1、相交不分如事、吏、卅、聿、夹、屯、册等。
被其它笔画穿过的部件(或字块)亦算相交,不分块。如半、未、来、束都为一块字(整体字);拳、叛、脊、函、丞、亟都为二块字等。
2、相离可分如品、最(日耳又)、断(米丨斤)、或(戈口一)、武(一弋止)、字(宀子)、块(土夬),等等。
单独的点(丶),不作一个字块。点只是与其它笔画构成一个字块(点在许多字中是辅助笔画)。如衤、瓦、永、发、良、朗、韧、低、辅、帼,等等。
如果字中含有4个或4个以上相分离的部件,那么试着将这个字按字义或结构先分成两个部份。
优先考虑将第一部份做一个块,在第二部份取两个分离的块。如髹、鬓、髫、髻、髭、鬈、鬃、鬏、骱、髋、超、麝、勰。
如果第二部份只是一个分离的块,那么就在第一部份取二个块。如繄、繁、罄、雕、煎、亸、氍等等。
这是因为有些汉字的偏旁是二分的,如髟(髭鬈鬃)、风(飓飑飗飕)、走(起超趟趋)、虍(虎虏等)、骨(髁髋髀)、麻(摩魔縻)、鹿(麈麋麝),等等。如果在这些偏旁上(绝大多数是出现在第一部份)取两块,就会造成3码内,重码较多。
在有4个或4个以上分离部件的情况下,优先考虑将偏旁(或第一部份)作一个块,在第二部份取两字块,就可避免这种重码。
3、相接的部件有条件地分(1)、当相离的字块数不足三块时,才对相接的部件分块。如削、放、育、界、善、总等。
(2)、由相接的部件分出来的两个字块,每个块应是由两个或两个以上笔画组成的常用构字部件,且含有“和码字根[字块]表”中所列的字根或字块。
和码字根[字块]表 注[]中的内容为字块。41厶幺纟;32 45忄小。
(表2)如辛(立十)、真(十且八)、累(田幺小)、示(二小)、元(二儿),足(口止)、促(亻口止)、赶(土止干),等等。
(3)、唯一搭配的字块不分。
字块中有一个部份,是该字块特有的,从不在别的字块中出现,如①、‘步’字,‘止’下面的三个笔画只与‘止’组合,从不与其它部件组合。这种就叫唯一搭配,这种字块不分。例字频、颦、涉。
②、‘肆’字的左半是唯一搭配的字块。例字髟、鬓等等。
③、‘缶’字是唯一搭配的字块,例字缺、窑、谣、淘等。
④、‘卸’字的左半是唯一搭配的字块,例字御。
⑤、‘骨’字的上半是唯一搭配的字块,不分块。
⑥、‘赍’字的上半是唯一搭配的字块,不分块。
对国标GB2312中的6763个汉字进行分块,统计表明,三块字约占80%,二块字约占15%,一块字约占5%。
按照以上的规则对单字分块是容易的,但也有少数字,需要做说明。
“并”分为两块(‘丶丿一’廾),而不是(‘丶丿’开);“关”分为两块(‘丶丿一’大),而不是(‘丶丿’天)。
相关的字有拼屏联饼骈朕姘洴栟帡胼,等等。
“酋”分为两块(‘丶丿’酉)。相关的字有尊遒奠猷鞧蝤,等等。
(三)、单字的取码规则和码中,单字的全码,最多为3+1共四个码,前三个码为主码,第四码为补码。和码对单字的取码方法是,先将单字按组成结构的“相离可分,相接有条件地分,相交不分”的规则分块,再采取“块取首根+剩余部分取最大码值”的方法取3个主码,依书写次序排列的3个主码分别为单字的第一、二、三码,在3个主码取完后的剩余部份取最大码值的码作为补码(第四码)。具体规则如下。
1、对三块字按‘块取首根’,每字块各取一码,得三个主码。依书写次序排列的3个主码分别为单字的第一、二、三码,在3个主码取完后的剩余部份取最大码值的码作为补码(第四码)。

2、对二块字按‘块取首根’,每字块各取一码,得二个主码,在剩余部分取一个最大码值码为主码,依书写次序排列的3个主码分别为单字的第一、二、三码,在3个主码取完后的剩余部份取最大码值的码作为补码(第四码)。

3、对一块字按‘块取首根’,取得一个主码,在剩余部分取最大、次大码值码的为两个主码,依书写次序排列的3个主码分别为单字的第一、二、三码,在3个主码取完后的剩余部份取最大码值的码作为补码(第四码)。

(四)、各种符号的编码方法符号包括标点符号、数学运算符号、各种数字符号、字母符号、制表符号,等等。和码用不同的第一数字码,区别不同类型的符号。再用第二、第三数字码为同一类型的符号编码。

在大字母键盘上26个字母键中的25个,对应于和码的25个数字输入码,剩下的一个字母“M”输入码值0。
大键盘上已标出的符号,以及更多的没有标出的符号都可以通过编码输入。字母“M”输入码值0。
1、0 11,等同于第一码是6,输入标点符号。
2、0 12,等同于第一码是7,输入数学运算符号。
3、0 13,等同于第一码是8,输入数字符号。
4、0 14,等同于第一码是9,输入英文字母符号。
5、0 15,输入制表符号。
在手机和小数字键盘上1、6(或0 11),输入标点符号。
2、7(或0 12),输入数学运算符号。
3、8(或0 13),输入数字符号。
4、9(或0 14),输入英文字母符号。
5、0 15,输入制表符号。
如“,”6 11;“”6 51 12;“>”7 22;“∩”7 23 13;“3”8 13; “③”8 13 22;“A”9 11; “a”9 11 12。

0 15 51 12;

0 15 33 13。
三、和码汉字数字输入法的第三种编码方法的有益效果和码汉字数字输入法的第三种编码方法,把汉字的4个编码,分为3个主码与1个补码。依书写次序排列的3个主码分别为单字的第一、二、三码,在3个主码取完后的剩余部份取最大码值的码作为补码(第四码)。使得单字的取码顺序更大程度地与字的书写顺序一致。
第三种编码更合乎人们的写字习惯,更易接受,编码更方便。
具体实施例方式
和码汉字数字输入法具体实施需要结合不同的设备通过制作输入软件在设备上由键盘实现。和码的25个数字码可按其数字顺序分布在不同设备的输入键盘上。
对于计算机的标准大键盘,和码的25个码使用26个英语字母键中的25个键,多余的一个字母键作为和码的0码值键,在汉字编码中如果字或词的码数不够4码时可用0码值补足。大键盘上的标点符号键,可直接输入对应的标点符号。大键盘上的其他辅助键和功能键也可为和码输入法的程序所用。
手机和其它数字键盘上都有十个数字键0、1、2、3、4、5、6、7、8、9,和码汉字的编码只使用其中1~5五个键。利用1、2、3、4、5的两两组合输入和码的25个数字码。6、7、8、9四个键可用作输入的标点符号、数字运算符号,数字符号及英文字母。
权利要求
1.一种“和码汉字数字输入法”的单字取码方法,其特征是把单字按组成结构的“相离可分,相接有条件地分,相交不分”规则,分为三块字、二块字或一块字,单字全码最多为3+1=4个码,前三个码为主码,第四码为补码,单字采取“块取(最大码值的)首根+剩余部分取最大值码”的方法取三个主码,对三块字按‘块取(最大码值的)首根’,每字块取一码,得三个字块主码,对二块字按‘块取(最大码值的)首根’,每字块取一码,得两个字块主码,再在剩余部分取一个最大值码为主码,对一块字按‘块取(最大码值的)首根’,得一个字块主码,再在剩余部分取最大、次大值码作为两个主码,依书写次序排列的三个主码,分别为单字的第一、二、三码,在三个主码取完后的剩余部份取最大码值的码作为补码(第四码)。
2.根据权利要求1所述的一种“和码汉字数字输入法”的单字取码方法,各数字码所含笔画与部件及其在5×5的矩阵格子中的排序特征是横方向以横(包括提与横折)(横是与其它笔画相离或相接的横)、横(与其它笔画相交的横)、竖、撇、点(捺)为序,纵方向按笔画与部件对字义或字结构的限定性大小为序,和码字根表如以下表所示。和码字根表 注41厶幺纟; 32 45忄。
3.根据权利要求1所述的一种“和码汉字数字输入法”的单字取码方法,单字的分块规则是“相离可分,相接有条件地分,相交不分”,由相接的部件分出来的两个字块,每个块应是由两个或两个以上笔画组成的常用构字部件,且含有“和码字根[字块]表”中所列的字根或字块,“和码字根[字块]表”如下表所示,[]中的内容为字块。和码字根[字块]表 注[]中的内容为字块。41厶幺纟; 32 45忄。
全文摘要
和码汉字数字输入法的第三种编码方法,把单字按组成结构的“相离可分,相接有条件地分,相交不分”规则,分为三块字、二块字或一块字。单字全码最多为3+1=4个码,前三个码为主码,第四码为补码。单字采取“块取(最大码值的)首根+剩余部分取最大码值”的方法取三个主码,对三块字按‘块取首根’,每字块取一码,得三个字块主码,对二块字按‘块取首根’,每字块取一码,得两个字块主码,再在剩余部分取一个最大值码为主码,对一块字按‘块取首根’,得一个字块主码,再在剩余部分取最大、次大值码作为两个主码。依书写次序排列的三个主码,分别为单字的第一、二、三码。在三个主码取完后的剩余部分取最大码值的码作为补码(第四码)。
文档编号G06F3/023GK1786885SQ200510110170
公开日2006年6月14日 申请日期2005年11月8日 优先权日2005年11月8日
发明者欧阳贵林 申请人:欧阳贵林
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1