世纪码汉字输入法(包括世纪形码和世纪形音码)的制作方法

文档序号:6605968阅读:415来源:国知局
专利名称:世纪码汉字输入法(包括世纪形码和世纪形音码)的制作方法
(包括世纪形码和世纪形音码)世纪码汉字输入法作为一个汉字输入法系列,其包括世纪形码和世纪形音码两种汉字输入法。
大部分现有形码汉字输入法的缺点键盘编码部件很多、分布规律性不强、难掌握、易遗忘,拆字很困难,重码较多。
发明目的是为各行各业、各层次的计算机使用人员提供即学即用、拆字极其简单、重码少、输入快捷的汉字输入法。
世纪码汉字输入法的优点键盘编码部件少,分布规律统一,符合汉字的书写规范;拆字极其简单;重码极少使用二十六个字母键作为编码键,不影响标点符号和数字的正常输入;键盘编码部件基本上是正常的汉字偏旁部首;因使用了二十六个键,简码多;字的全码最多为四码。
世纪码汉字输入法在编码思想上有重大突破。世纪形码中引入了“交连体”、“散笔”等一些重要概念,是世纪形码的根本所在;世纪形音码中由字体结构确立汉字的编码,是世纪形音码的根本所在。第一部分 世纪形码简介一、世纪形码的特点1、键盘编码部件少,分布规律统一,符合汉字的书写规范,根据汉字的书写笔画即可确定部件的编码,易学易记,不易遗忘。2、拆字极其简单,部件之间具有积木式的结构,部件之间“既不相交也不相连”,界限分明,每个部件都独立成块。3、重码少,正常输入时一般不用选字。4、使用二十六个字母键作为编码键,不影响标点符号和数字的正常输入。5、键盘编码部件基本上都是正常的汉字偏旁部首,常见的基本的汉字偏旁部首都不被拆分。6、因使用了二十六个键,除一级简码外,二级简码、三级简码多,极大部分常用字有简码。7、设置了部件提示码,就好象把编码部件刻在键盘上一样。8、为处理重码,采用了特码和变码技术。9、为具有代表结构的字和极少的几个难字设置了用于查询的短句提示码。二、世纪形码的汉字笔画笔画书写楷体字时不停顿不提笔一次写完的连续不断的线段。汉字的五种笔画根据笔画的定义,世纪形码按笔画书写的走向和笔画的特征将汉字的笔画规定为五种---横、竖、撇、捺、折。横从左向右一次书写完的直笔。
提笔视为横,如“牜”、“冫”、“疒”、“氵”等部件的末笔。竖从上向下一次书写完的直笔。
左竖钩视为竖,如“小”、“水”等部件的首笔;“刂”、“事”、“了”等部件的末笔;“寸”、“子”、“孓”等部件的次笔。撇从右上向左下一次书写完的不带折的平滑笔画。
左点视为撇,如“冖”、“州”等部件的首笔。(注撇画左边的点一般都算左点,归入撇画。)捺从左上向右下一次书写完的不带折的平滑笔画。
右点视为捺,如“宀”、“讠”、“之”、“礻”、“衤”等部件的首笔。折除左竖钩外,所有带折带钩的笔画。如“戈”、“弋”、“七”、“饣”、“鱼”、“犭”、“冖”、“讠”、“虫”、“囗”、“纟”等部件的次笔。三、笔画之间的结构关系相交单笔画相互交义出头。如“十”、“廾”、“卅”、“车”、“屯”等。(注意不要将相接而未交叉出头的笔画视为相交。“丁”、“工”、“非”、“山”、“止”、“卜”、“皿”、“幺”等字体的所有笔画之间均无相交关系。)相连单笔画之间端点相接。如“厂”、“匚”、“冖”、“凸”、“口”、“囗”、“凹”、“冂”、“几”、“弓”、“尸”、“己”、“巳”、“凵”、“卩”、“了”等字体的所有笔画之间均为相连关系。(注根据定义可知,所有的框型结构中笔画均为相连。)四、世纪形码的编码部件1、键盘编码部件世纪形码键盘编码表如下
世纪形码用二十六个字母键对汉字进行编码,不用切换即可输入标点符号和数字。
世纪形码将二十六个字母编码键分成二十五个区位键和一个N调节键,二十五个区位键又分成五个区,每区五键位。
五个区中,除“扌”、“心”两个部件外,部件首笔都和区号相对应,即横起笔的部件都分布在一区,竖起笔的部件都分布在二区,撇起笔的部件都分布在三区,捺起笔的部件都分布在四区,折起笔的部件都分布在五区;除部分键名和键盘部件“心”外,其余键盘部件的次笔都和位号相对应,即次笔为横的部件都分布在相应区的第一位,次笔为竖的部件都分布在相应区的第二位,次笔为撇的部件都分布在相应区的第三位,次笔为捺的部件都分布在相应区的第四位,次笔为折的部件都分布在相应区的第五位。
例键盘部件“戊”,首笔为一横,部件分布在第一区,次笔为一撇,部件分布在第三位,由部件“戊”的首笔和次笔可以确定其分布在一区三位,键位为“13”,即在D键上。
为了使键盘有比较合理的布局,也为了充分地利用二十六个字母键,减少重码,除区位键外,世纪形码定义了一个调节键,即字母键“N”。其上分布了“冂”、“贝”、“冖”、“夂”、“几”五个部件,部件具有下框形,和字母键“N”的英文小写形似。
五个单笔作为特殊的部件依次分布在键盘第三排“Z”、“X”、“C”、“V”、“B”五个键上,简介后对此还有详细介绍。
区位键键名部件王木石(土士)雨山口(目罒)(日曰)虫(钅金)白月_(饣食)方(艹
廿甘)火(氵水氺)(讠言)马(阝耳)女扌纟区位键键名部件读记王木石土雨山口目日虫金白月竹食方草火水言马耳女提丝注键名部件均按非成字主要偏旁部首部件的首次笔定位分布,成字偏旁部首部件“金”、“食”、“水”、“氺”、“言”、“耳”取音取义随主要偏旁部首分布;部件“士”、“罒”、“曰”、“
”、“廿”、“甘”取型随主要偏旁部首分布。
世纪形码键盘部件读记一区二区 三区11 G王_(青头)21 H山上止_(虎) 31 T钅(金)牜(牛)禾气12 F木寸工22 J口刂(利刀)业 32 R白鬼身亻(单人立)13 D石大戊豖(琢右)23 K目小忄_(心) 33 E月舟
(连撇)彳(双人立)14 S土士 24 L日_(当头)门卜 34 W_(竹头)人八灬(四点)爫(采头)15 A雨匚(右框)戈弋25 M虫骨囗(方框)田皿 35 Q饣(食)鱼鸟犭(狗旁)四区 五区41 Y方广疒(病)(冫丬)(两点)立 51 B马42 U艹(
廿甘)(草头集)52 V阝卩(耳)43 I火宀(宝盖)米 53 C女刀匕皮44 O 氵(水氺)(三点水) 54 X扌(提)厶(SHI)45 P 讠(言)(言旁)辶(之)礻(示)衤(衣)55 Z纟(丝)幺(YAO)调节键部件冂(下框) 贝冖(军盖) 夂(条头)几偏旁部首按括号内的字词读记。括号内的非斜体字为取音取义随主要偏旁部首分布的键盘编码部件;括号内的斜体字仅为其前的对应部件释义,而非键盘编码部件。
另外,“U”和“N”键上的部件结构正好相反,“U”键上的部件结构具有上框形,“N”键上的部件结构具有下框形,都和字母结构形似。2、交连体编码部件前面,世纪形码给出了笔画相交相连的明确定义,这里由此给出世纪形码中的一个重要概念---交连体。
交连体汉字字体中,所有笔画都相交相连所构成的一个笔画块。
世纪形码规定,汉字编码时,所有相交相连的笔划一律不拆分,每个交连体都单独作为编码部件进行编码。
GBK字符集中可输入交连体部件编码表如下
(注不可输入交连体部件及其编码根据汉字的实际书写情况由其首笔次笔而定)交连体部件编码极其简单,健盘分布遵循统一的规律。即交连体部件的首笔确定其编码的区号,交连体部件的次笔确定其编码的位号。交连体部件的首笔和次笔由汉字笔画的书写顺序确定。
例部件“车”,所有笔划都相交,整体为交连体,由其首笔和次笔可以确定其分布在一区五位,键位为“15”;部件“尸”,所有笔划都相连,整体为交连体,由其首笔和次笔可以确定其分布在五区一位,键位为“51”; 部件“电”,所有笔划或相交或相连,整体为交连体,由其首笔和次笔可以确定其分布在二区五位,键位为“25”。
世纪形码为了使编码更简单,使编码部件成块状,对交连体部件还有两个特别规定(不包括键盘交连部件,键盘交连部件必须独立编码。)(1)、所有交连体的右上单点都作为交连体的一部分,且作为交连体的未笔(补码时有用)。这样的部件有“戋”、“甫”、“书”等。(注意键盘部件右上单点应单独编码,如“犬”字,应拆分成“大”和“丶”两个部件,另有“术”字。)(2)、所有交连体的内笔都作为交连体的一部分。内笔分两种情况A.被交连体笔划四面包围的笔画,含这种内笔的交连体部件有“丹”、“叉”、“母”等;B.按书写顺序,写于交连体笔画之内的笔画,含这种内笔的交连体部件有“臼”、“彐”等,另有“段”的左边部份。
(注意键盘部件“匚“、“囗”、“夂”的内笔应拆出编码;汉字字体中,键盘部件“弋”、“戈”、“戊”应独立编码,其内笔应拆出编码,如“式”、“戎”、“成”等字。)交连体部件编码表的部件分布特征总体上,交连体部件集中分布在左边和下边,四区无交连体部件。
首笔为竖的交连体部件都分布在“M”键上,键位为“25”。
首笔为横,且为上下二横的交连体部件都分布在“G”键上,键位为“11”;首笔为横,横笔下为方框和下框形结构的交连体部件都分布在“F”键上,键位为“12”;首笔为横,含“七”字形结构的部件都分布在“A”键上,键位为“15”。
首笔为折,且含左框形结构的交连体部件都分布在“B”键上,键位为“21”;首笔为折,且含“了”字形结构的部件都分布在“V”键上,键位为“22”。
掌握交连体部件的键盘分布特征,对快速确定交连体部件的编码,提高汉字的输入速度有很大的好处。3、散笔编码部件根据前面的介绍,世纪形码的键盘编码部件很少,除少数几个外,极大部份都是常见的汉字偏旁部首,而所有的交连体编码部件又不可拆分,自然,世纪形码编码时会产生一些既不属于键盘编码部件又不属于交连体编码部件的笔画。
世纪形码为了使汉字能够顺序拆分编码,在键盘编码部件和交连体编码部件的基础上,定义了散笔编码部件。
散笔汉字字体中,被键盘编码部件和交连体编码部件分隔的既不相交也不相连的顺序单笔画块或单笔画。
世纪形码规定,汉字编码时,被键盘编码部件和交连体编码部件分隔的既不相交也不相连的顺序单笔画块或单笔画都单独作为编码部件进行编码,称为散笔编码部件。
根据散笔编码部件的定义,散笔编码部件是非固定的编码部件,其根据散笔被键盘编码部件和交连体编码部件分隔的情况而定。
另外,除下面将介绍的两种情况外,被键盘编码部件和交连体编码部件分隔的既不相交也不相连的每个顺序单笔画块只能作为一个散笔编码部件进行编码,即编码时取一码。
例汉字“将”中,散笔“夕”被键盘部件“丬”和“寸”分隔,应作为散笔编码部件;汉字“垤”中,散笔“一”被键盘部件“土”和“厶”分隔,应作为散笔编码部件;汉字“可”中,散笔撇“一”和捺“丨”被交连体“口”分隔,应顺序拆分成“一”、“口”和“丨”三个部件。GBK字符集中可输入散笔部件编码表如下:
(注不可输入散笔部件及其编码根据汉字的实际书写情况由其首笔次笔而定)同交连体部件,散笔部件编码键盘分布遵循统一的规律,即散笔部件的首笔确定其编码的区号,散笔部件的次笔确定其编码的位号。
为了统一,非对称结构散笔部件的首笔和次笔严格按从左至右、从上至下的顺序确定,和汉字的书写顺序基本一致,如“片”字;对称结构散笔部件的首笔和次笔按汉字的书写顺序确定,一般遵循先中间后两边的原则,如“非”字。
例散笔部件“与”,从左至右,由其首笔和次笔可以确定其分布在五区一位,键位为“51”; 散笔部件“非”,先中间后两边,由其首笔和次笔可以确定其分布在二区一位,键位为“21”。
世纪形码为了使编码部件直观明了,使编码部件成块状,对散笔部件还有两个特别规定(1)、如果汉字字体中包含左右结构,左右结构中包含顺序写出的散笔,除散笔外,左右结构中还包含至少一个键盘编码部件或交连体编码部件,那么,左右结构中顺序写出的散笔应单独分别编码。
其结构理论上有三种:


例“顺”、“师”、“既”等,这种情况的字极少。
(2)、如果汉字字体中包含上下结构,上下结构中包含顺序写出的散笔,除散笔外,上下结构中还包含至少一个键盘编码部件或交连体编码部件,那么,上下左右结构中顺序写出的散笔应单独分别编码。
其结构理论上也有三种①

img/>例“死”、“雍”字,这种情况的字只有极个别。
除上面两种特殊情况外,顺序写出的单笔画块只能作为一个部件进行编码,即只能取一码。
在键盘编码部件的讲解中,五个单笔画依次列于键盘编码部件表第三排的五个键上。实际上,五个单笔画不属于键盘编码部件,而属于特殊的散笔编码部件,只是其按键盘编码部件表中的分布取码。
至此,关于世纪形码的编码部件已介绍完。根据前面的介绍可知,世纪形码的编码部件包括键盘编码部件、交连体编码部件、散笔编码部件和“五个单笔画”特殊的散笔编码部件。五、世纪形码的编码原则世纪形码编码时,除键盘含交连笔画的部件外,编码部件之间应严格按汉字的书写顺序进行拆分;除部分散笔编码部件之外,世纪形码的编码部件都成块状结构,各编码部件之间都具有积木式的结构。
特别注意,除由交连笔画构成的键盘编码部件外(包括键盘编码部件交连笔画含右上单点的情况),键盘编码部件的所有笔画必须都是顺序写出,且成块状,而不能被分隔。
跟其它形码编码原则一样,在不违背编码部件之间积木式结构的前提下,世纪形码编码时,遵循部件“取大优先”的原则。如部件“白”不可拆分成“丿”和“日”。六、世纪形码的字词编码1、单部件字的编码单笔画字“一”和“乙”编码分别取为“ZA”和“BAA”。其中,“Z”和“B”为单笔画字“一”和“乙”的部件码。“A”和“AA”为人为规定码。
其它单部件字的编码为单部件字的部件取码+单部件字的首末笔结合补码+单部件字的拼音首字母补码例“厂”字部件取码为“D”,首笔为横,末笔为撇,首末笔结合补码为“D”,拼音首字母为“C”,“厂”字的全码为“DDC”;“瓦”字部件取码为“A”,首笔为横,末笔为捺,首末笔结合补码为“S”,拼音首字母为“W”,“瓦”字的全码为“ASW”。
单部件字除此正常编码外,还可由后面介绍的部件提示码直接输入。
单部件字总共只有一百多个。2、两部件字和三部件字的编码字的各部件顺序取码+字的首部件末笔和末部件末笔结合补码例“时”字首部件取码为“L”,末部件(也为次部件)取码为“F”,首部件末笔为横,末部件末笔为捺,字的首部件末笔和末部件末笔结合补码为“S”,“时”字的全码为“LFS”;“结”字的首部件取码为“Z”,次部件取码为“F”,末部件取码为“J”,首部件末笔为横,末部件末笔为横,字的首部件末笔和末部件末笔结合补码为“G”,“结”字的全码为“ZFJG”。3、四部件字和多于四部件字的编码对于四部件字,字的各部件依次编码即可;对于多于四个部件的字,字的前三码按字的前三个部件依次取码,第四码取字的最后一个部件的编码。4、世纪形码编码部件提示功能世纪形码中,除部分非成字交连体部件和散笔部件外,世纪形码的成字编码部件都含有部件提示码“部件码+‘AAA’码”,部件提示码紧跟在一级简码的后面。
部件提示码按三个层次进行分布键盘编码部件→成字交连体部件→成字散笔部件。
例当用世纪形码输入汉字时,如果单按“G”键,编码提示框中会依次显示如下-----1表2元A3王AAA4_AAA5丰AAA6韦AAA7戋AAA8井AAA9二AAA10三AAA11亍AAA12亏AAA13元AAA14亓AAA其中,“1”为一级简码,“2”为二级简码,“3-4”键盘编码部件,“5-8”为交连体部件,“9-14”为成字散笔部件。
显然,单部件字也可直接通过部件提示码选择输入,如“二”字,可通过单按“G”键,而后在编码提示框中选择数字“9”输入。5、词组输入两字词的输入依次取两个字的前两码三字词的输入前两个字依次取首码,第三字顺序取两码四字词的输入每字依次取首码多于四字词的输入前三字依次取首码,第四码取最后一字的首码6、补码时,单笔画作为特殊散笔部件,其首笔和末笔同。
如“天”字,其部件可拆分为单笔部件“一”和键盘部件“大”; 补码时,单笔部件“一”的首笔和末笔同,均为横,“大”的末笔为捺,“天”的补码应为“S”,键位为“14”;“天”字的全码应为“NDS”。七、世纪形码的一级简码或来有事表(ASDFG)上口性是中(HJKLM)外人后使和(QWERT)就劳关兴计(YUIOP)可以我为与(ZXCVB)的(N)注除“的”字外,其它所有一级简码字的简码均为简码字全码的首码。用全码输入时,因“事”、“人”、“计”三个字的正常全码有重码,它们的正常全码后应补以“A”码,如全码输入时,“人”和“入”重码,为避免重码,“人”的全码应为“WWRA”。八、世纪形码的二级简码A B C D E F G H I J K L M N O P Q R S T U V W X Y ZA 七雪切需斩辅车匪辖划忒霄轴雾 连匹霓雨医霸夷区轻较辆B 民己比异肃导层蛋灵避忌屑届费尽 弥驯丑改展尺退建习己C 长女力升 杂手延释加自旨血向 边奶嫂靠姓媒好办及妨系D 万成破厂有套石碳碰右夏不面而泵达确原在殊 太爽友矿研E 彻很肠须朋斤行微胖得盘肌 脉胸州待月膜肥舟反脑斥F 世根才都析村本 丧古相朴棵直汞过构棉杜株模术束支求柄G 元 玻弄青球二璨琮璞示琐理责 进表瑰 玫璜专未云奏毒H 辈岂此岩肯巅 非崇山悲卡卤贞岁嵬峡屹嵌嵋齿餐虔崾I 炼兼安家前守完灿灾总首爆审粗火迷燃宾灶牢宽粮益烃粒定J 号嘱另喊听叶呈业咛品吵唱虽员 咏兄唯吐鉴哄叫只叹咬吓K 惭忆少尖忻署情目瞎愕眇小忡惧 罚罗怕尘性懂慑心怪忙师L 晓当照光明时旺日阐显冒间门常阔 易阀阖星暴闻闪暌影题M 畏幄男因胃困国由圈回忠史电图 迪四帕遇蛛蜡内果贻骸里N 军写务贿贩条用贴赠各 处备冗冬 几凰周败 凡风凤赃同O 汇津波头洲泄污涉洋滥泪水油没淼泳浓泊法汽满注兴汉泣河P 试记初诚衫订讲让详祝 补神设之 谄训评诱谋议认译言语Q 氏争农然匆匍狂岛卵名忽外象负 狱儿猴狭册猎色多勾匀犯R 代亿化优身体伟仙伙保儇们伸段泉信片伯佳作供他价仅位便S 域块场坏垢平士走幸吉志坦埋壳均赤封 塔地来去垃坶T 钝银秘知钥年钱钻秋利怎复种租科迄气牛特重错季朱私稿生U 莲艺苏茂芹某其 蔽蓝芯昔革荣范蔼警花莱茱苷节共茅芳药V 阵子承随阴 主耻联职眉阳聃阻 辽陷附陕收 了义取防也W 兮第分希筋笨全企管篮算简笛受簿今豹介等遥簧凶从个禽叙X 找扎执买折柔扶排拦台抄旧抽通抖 允拍持拖措把以双扩抚Y 库弯妄产肓亲凑站广熟忘音市商应方疚夜壮放度孪这变立率Z 练幻幼天绷于线正灭可纱下再贯 巡约百结绣绀纠纷书统幽九、世纪形码的特码为了避免重码选字,部分字除了正常编码和简码外,还有特殊编码。对两部件字,特码为补码改为“A”,或补码后再补“A”;对三部件字,特码为补码改为“A”;对四部件字和多于四部件字,特码为末部件编码改为“A”。另外,个别特码有例外,如补AA、AB、B或补C,补C的特码极个别。对常用字,特码有三码特码和四码特码。
例“加”和“召”为重码,两个字的正常编码为“CJT”。“加”字除简码“CJ”和正常编码“CJT”外,有特码“CJTB”;“召”字除正常编码“CJT”外,有特码“CJA”和“CJTA”。十一、世纪形码的变码在世纪形码的重码中,有些字在正常输入时极少使用,如罕见的性别、地名等。在世纪形码的编码中,如果这些字和常用字重码,则去掉这些字的正常编码,而采用变码。
对两部件字,变码为正常编码后补以“A”;对三部件字,变码为补码改为“A”;对四部件字或多于四部件字,变码为末部件编码改为“A”。极个别变码有时补“B”或“C”。
可以看到,变码字均为四码,变码字在输入前三码后,均可直接显示于编码提示框中,即编码提示框不用翻页,变码字即可显示出来。可见,变码字的输入也很简单。
例“化”和“仂”为重码,两个字的正常编码为“RCK”,“仂”字采用变码“RCKA”。当输入三码后,“仂”字即可显示于“化”字之后。
如果不采用变码,世纪形码的重码共有三百多个,采用变码后,世纪形码的重码只有一百八十一个。
变码字共有近两百个。十二、世纪形码的典型字和难字短句提示码世纪形码给具有代表性结构的典型字和几个难字给出了短句提示码,短句提示码为“GGG”。由短句提示码可查看具有代表性结构的典型字的编码结构,从而掌握这种结构字的编码。另外,几个难字也用相同的短句提示码列于其后。
例“生”字编码时应拆分成编码部件“牛”和“一”,“生编码牛一”即反应了“生”字的编码拆分情况;世纪形码中给短句“生编码牛一”定义了提示码“GGG”,按提示码“GGG”,短句“生编码牛一”即列于编码提示框中,从而可知“生”字的编码。
有提示码的短句结构为“具有代表性结构的典型字”+“编码”+“字所顺序拆分的编码部件或编码代号部件”由于世纪形码中的有些交连体部件和散笔部件是不可单独输入的,在提示码短句中即用“编码代号部件”来替代这些编码部件,“编码代号部件”的编码同这些不可单独输入的部件的编码是一致的。例编码提示短句“及编码丿又”中的“又”即为编码代号部件,其对应编码为“X”。
所有的编码提示短句列于下生编码牛一GGG下编码一卜GGG斤编码
丁GGG丘编码亻工GGG百编码一白GGG必编码丿厶丶GGG兆编码冫儿GGG习编码乙冫GGG及编码丿又GGG夹编码土、GGG可编码一口丨GGG既编码弓丶一乙GGG死编码一饣匕GGG光编码_兀GGG益编码米八皿GGG具编码冂三八GGG留编码饣丶刀田GGG蛋编码乙止虫GGG农编码饣女GGG乘编码丿十丁八GGG肉编码冉、人GGG两编码一冉、GGG北编码丁匕GGG酉编码一冉GGG朱编码牛八GGG臣编码匚丨弓丨GGG叟编码亻又GGG存编码厂子GGG段编码亻几又GGG卵编码饣米阝GGG印编码饣一卩GGG登编码厶口米GGG尤编码厂乙GGG琢编码王厂人GGG鼠编码亻厶GGG髟编码丁厶彡GGG隹编码亻亠_GGG疏编码乙止亠亻GGG尴编码厂乙口皿GGG幽编码丨幺幺凵 GGG豳编码上凵GGG
第二部分 世纪形音码简介一、世纪形音码的特点1、键盘编码部件极少,总共只有近四十个,主要选取了世纪形码的键名部件,且和世纪形码的分布是基本统一的。2、不用拆字。3、重码少。4、使用二十六个字母键作为编码键,不影响标点符号和数字的正常输入。5、世纪形音码实际上综合了几种编码,即使不使用拼音,也可正常地输入汉字。6、因使用了二十六个键,除一级简码外,二级简码、三级简码多,极大部分常用字有简码。二、世纪形音码的汉字笔画(和世纪形码规定相同)笔画书写楷体字时不停顿不提笔一次写完的连续不断的线段。汉字的五种笔画根据笔画的定义,世纪形音码按笔画书写的走向和笔画的特征将汉字的笔画规定为五种---横、竖、撇、捺、折。横从左向右一次书写完的直笔。从左向右一次书写完的提笔视为横,如“牛旁”、“冫”、“疒”、“氵”等部件的末笔。竖从上向下一次书写完的直笔。左竖钩视为竖,如“小”、“水”等部件的首笔;“刂”、“寸”、“事”、“了”等部件的末笔;“子”、“孓”等部件的次笔。撇从右上向左下一次书写完的不带折的平滑笔画。左点视为撇,如“冖”、“州”等部件的首笔。(注撇画左边的点一般都算左点,归入撇画。)捺从左上向右下一次书写完的不带折的平滑笔画。右点视为捺,如“宀”、“讠”、“之”、“礻”、“衤”等部件的首笔。折除左竖钩外,所有带折带钩的笔画。如“戈”、“弋”、“七”、“饣”、“鱼”、“犭”、“冖”、“讠”、“虫”、“囗”、“纟”等部件的次笔。三、世纪形音码的编码部件世纪形音码键盘编码表如下
世纪形音码用二十六个字母键对汉字进行编码,不用切换即可输入标点符号和数字。
世纪形音码将二十六个字母编码键分成二十五个区位键和一个调节键,二十五个区位键又分成五个区,每区五键位。
五个区中,除“扌”和“艹、
廿”部件外,部件首笔都和区号相对应,即横起笔的部件都分布在一区,竖起笔的部件都分布在二区,撇起笔的部件都分布在三区,捺起笔的部件都分布在四区,折起笔的部件都分布在五区;除部分键名部件外,部件的次笔都和位号相对应,即次笔为横的部件都分布在相应区的第一位,次笔为竖的部件都分布在相应区的第二位,次笔为撇的部件都分布在相应区的第三位,次笔为捺的部件都分布在相应区的第四位,次笔为折的部件都分布在相应区的第五位。
例键盘部件“石”,首笔为一横,部件分布在第一区,次笔为一撇,部件分布在第三位,由部件“石”的首笔和次笔可以确定其分布在一区三位,键位为“13”,即在D键上。
为了使键盘有比较合理的布局,也为了充分地利用二十六个字母键,减少重码,除区位键外,世纪形音码定义了一个调节键,即字母键“N”。其上分布了“贝”、“足”二个部件。
区位键键名部件王木石(土士)雨山口(目罒)(日曰)虫钅白月_饣方(艹
廿)火氵讠尸阝女扌纟区位键键名部件读记王木石土雨山口目日虫金白月竹食方病火水言尸耳女提丝四、世纪形音码的字词编码1、两笔结合编码原则前面已经介绍汉字的五种笔画,五种笔画分别和键盘的五个区、五个位相对应。
两笔结合编码为第一笔确定编码的区号,由第二笔确定编码的位号,两笔结合确定编码的区位号。后面提到的两笔结合编码都遵循这个原则。
例第一笔为撇、第二笔为竖,两笔结合编码时,由第一笔可确定编码区号为“3”,第二笔可确定编码位号为“2”,两笔结合确定的编码区位号为“32”,对应的键盘编码字母为“R”。2、整体为左右结构字分两种情况①字的整体结构为<
其中,“A”为键盘部件。
总体编码为“A”部分编码+“B”部分编码+“C”部分编码+“A”部分末笔和“C”部分末笔结合补码。
“A”部分编码按部件在键盘上的分布取码。
“B”部分编码一律按其首笔和次笔结合编码。
“C”部分编码一律按其首笔和次笔结合编码。例“勒”字中,“廿”为键盘部件,其编码为“U”,整字全码为“UMCD”。
左边为“走”和“是”的字也按这种结构处理。如“起”、“题”字等。
这种结构的字不多。②除“①”外的所有其它左右结构字总体编码为左边部分编码+右边部分编码+左边部分末笔和右边部分末笔结合补码+字的拼音首字母补码。
左边部分编码如果左边部分总体为键盘部件,则按部件在键盘上的分布取码;否则,按其首笔和次笔结合编码。
右边部分编码含多笔画时,由首笔和次笔结合编码;为单笔画时,取编码“N”。例“坏”字,左边部分“土”为键盘部件,其编码为“S”;右边部分“不”,由其首笔和次笔可确定其编码为“D”,键位为“13”;左边部分末笔为“横”,右边部分末笔为“捺”,左边部分末笔和右边部分末笔结合补码为“S”,键位为“14”;字的拼音首字母补码为“H”;“坏”字的全码为“SDSH”。
“都”字,左边部分“者”,由其首笔和次笔可确定其编码为“F”,键位为“12”;右边部分“阝”,由其首笔和次笔可确定其编码为“V”,键位为“52”;左边部分末笔为“横”,右边部分末笔为“竖”,左边部分末笔和右边部分末笔结合补码为“F”,键位为“12”;字的拼音首字母补码为“D”;“都”字的全码为“FVFD”。
“引”字的全码为“BNVY”。
这种结构的字占汉字的极大部分。3、整体为左中右结构字总体编码为左边部分编码+中间部分编码+右边部分编码+左边部分末笔和右边部分末笔结合补码。
左边部分编码如果左边部分总体为键盘部件,则按部件在键盘上的分布取码;否则,按其首笔和次笔结合编码。
中间部分编码一律按其首笔和次笔结合编码。
右边部分编码一律按其首笔和次笔结合编码。例“例”字,其由“亻”、“歹”、“刂”三部分组成,全码为“RDJJ”。4、字的整体结构为<
其中,“A”部分为键盘部件。
总体编码为“A”部分编码+“B”部分编码+“C”部分编码+“D”部分编码。
“A”部分编码按部件在键盘上的分布取码。
“B”部分编码一律按其首笔和次笔结合编码。
“C”部分编码一律按其首笔和次笔结合编码。
“D”部分编码一律按其首笔和次笔结合编码。例“窃”字,其可拆分成“宀”、“八”、“七”和“刀”,全码为“IWAC”。
这种结构的字极少。
“A”部分不为键盘部件时,按下面的结构处理。5、字的整体结构为<
>总体编码为“A”部分编码+“B”部分编码+“C”部分编码+“A”部分末笔和“C”部分末笔结合补码。
“A”部分编码如果“A”部分总体为键盘部件,则按部件在键盘上的分布取码;否则,按其首笔和次笔结合编码。
“B”部分编码一律按其首笔和次笔结合编码。
“C”部分编码 律按其首笔和次笔结合编码。例“茯”字,其由“艹”、“亻”、“犬”三部分组成,全码为“ARDL”。6、字的整体结构为<
<p>总体编码为“A”部分编码+“B”部分编码+“C”部分编码+“A”部分末笔和“C”部分末笔结合补码。
“A”部分编码如果“A”部分总体为键盘部件,则按部件在键盘上的分布取码否则,按其首笔和次笔结合编码。
“B”部分编码一律按其首笔和次笔结合编码。
“C”部分编码一律按其首笔和次笔结合编码。例“势”字,其由“扌”、“丸”、“力”三部分组成,全码为“XQCD”。“辇”字,其由“夫”、“夫”、“车”三部分组成,全码为“GGAY”。7、字的整体结构为<
总体编码为“A”部分编码+“B”部分编码+“C”部分编码+“D”部分编码。
“A”部分编码如果“A”部分总体为键盘部件,则按部件在键盘上的分布取码;否则,按其首笔和次笔结合编码。
“B”部分编码一律按其首笔和次笔结合编码。
“C”部分编码一律按其首笔和次笔结合编码。
“D”部分编码一律按其首笔和次笔结合编码。例“翟”字的全码为“XXRY”。
这种字极个别。8、首部为键盘部件的上下结构字(前面第4、5两种情况除外)总体编码为首部键盘部件编码+其余部分编码+首部键盘部件末笔和其余部分末笔结合编码+字的拼音首字母补码。
其余部分编码含多笔画时,由首笔和次笔结合编码;为单笔画时,取编码“N”。例“穷”字,其全码为“UWCQ”;“艺”字,其全码为“UNMY”。9、总体上,由键盘部件“厂”、“广”、“疒”、“尸”作部首的杂体字,含“凵”(方框)的内外结构字总体编码为键盘部件“厂”、“广”、“疒”、“尸”或“囗”的编码+其余部分的首笔和次笔结合编码+首部键盘部件末笔和其余部分末笔结合编码+字的拼音首字母补码。例“疾”字的全码为“UTSJ”;“国”字的全码为“MGSG”。10、总体上,由键盘部件“辶”作部首的杂体字总体编码为除键盘部件“辶”外其余部分的首笔和次笔结合编码+键盘部件“辶”的编码+第一部分末笔和键盘部件“辶”的末笔结合编码+字的拼音首字母补码。例“连”字,其由“车”、“辶”两部分组成,全码为“APSL”。11、首部不为键盘部件的上下结构字和杂体字单笔画字“一”和“乙”的编码分别取为“NA”和“NAA”。
其它少于四笔画的字总体编码为字的首笔和次笔结合编码+第二码“N”+字的拼音首字母补码。例“于”字的全码为“GNY”。
四笔画字和多于四笔画字的总体编码为字的首笔和次笔结合编码+字的第三笔和字的末笔结合编码+字的拼音首字母补码。例“专”字的全码为“GXZ”。12、含右框的字中,一律规定按从外至内的顺序书写,即次笔为右框的折笔。13、词组输入两字词的输入依次取两个字的前两码三字词的输入前两个字依次取首码,第三字顺序取两码四字词的输入每字依次取首码多于四字词的输入前三字依次取首码,第四码取最后一字的首码五、世纪形音码的附加编码1、将所有字的拼音首字母补码改为“I”补码,这种情况不需知道字的拼音,但重码较多。世纪形音码中,所有字都有这种编码。例“码”字的主编码为“DZGM”,采用“I”补码时为“DZGI”。2、首部不为键盘部件的上下结构字和杂体字(即单部件字),除了前面两种编码外,还采用了第三种编码。
少于四笔画的字总体编码不变。
四笔画字和多于四笔画字的总体编码改为字的首笔和次笔结合编码(未变)+字的首笔和字的末笔结合编码(被改变)+字的拼音首字母补码(未变)+“U”补码(增设)。例“专”字的全码为“GSZU”。
这种编码作为一种附属编码,其特点是简单,不需知道字的第三笔如何书写。3、附加编码不用作词的编码五、世纪形音码的一级简码(和世纪形码相同)或来有事表(ASDFG)上口性是中(HJKLM)外人后使和(QWERT)就基关兴计(YUIOP)可以我为与(ZXCVB)的(N)
权利要求
1.世纪形码和世纪形音码的键盘编码部件选取及其分布。
2.世纪形码中,由笔画相交、相连新概念引入的交连体部件和散笔部件编码技术。
3.世纪形音码中,由汉字的结构特征确立的汉字编码技术。
4.世纪码汉字输入法中的两笔结合补码技术。
5.编码部件的部件码提示技术。
6.处理重码的特码和变码技术。
7.查询代表性结构字和难字编码的提示短句编码技术。
8.世纪形音码中的附加编码技术。
全文摘要
世纪码汉字输入法提供了两套汉字编码技术,属于使用计算机进行文字处理的汉字输入法软件。此发明可为各行各业、各层次的计算机使用人员提供即学即用、拆字极其简单、重码少、输入快捷的汉字输入法。主要解决了已有形码汉字输入法编码部件多、分布规律不强、拆字困难等难掌握易遗忘的问题。主要优点有:键盘编码部件少、分布规律统一,拆字极其简单,重码极少,使用二十六个字母键作为编码键。
文档编号G06F3/023GK1269541SQ9910264
公开日2000年10月11日 申请日期1999年4月5日 优先权日1999年4月5日
发明者童立志 申请人:童立志
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1