汉字属性分类码输入法的制作方法

文档序号:6604861阅读:410来源:国知局
专利名称:汉字属性分类码输入法的制作方法
本中发明属于计算机应用领域,涉及一种适用于各种汉字信息处理技术软件、硬件系统中(包括电脑系统、汉字电传机、汉字电脑打印机、汉字终端机和通讯系统)提供快捷的编码和输入方法的汉字属性分类码输入法。
多年来,人们养成一套用音、形、意、性各种属性来标识汉字的习惯。
例如,询问“尊姓大名”?最符合习惯的回答是“吴美一,口天吴,美丽的美,一二三的一”。此处,“口天吴”是字形、字音标识,“美丽的美”是词意标识,“一二三的一”是词性(数)标识,规则简单、明了、直接、富有成效。
目前,汉字编码大体分为形码、音码和音形码三种类型。音码虽易学,但同音字多,重码率高;形码大多有各异的复杂的编码规则,未经专门训练很难推广应用;音形码又需要掌握读音与字形两种因素,操作不便。
例如,《拼音输入法》(包括全拼、简拼、双拼码)分辨率低,重码字多,如“bi”音汉字有60个、“fu”音汉字有80多个、“ji”音汉字有110多个,需要逐屏选择,影响输入速度。《五笔字形输入法》拆字取码方法不符合常人的汉字识别规则,130种字根的编码方案过于复杂,难学难用。《自然码》以音为主的输入方法,但另配一套双音编码的方案,对原用拼音的用户甚为不便,对构成汉字的二、三百个部件用象音、象形、变体方法编码,规则复杂,缺少统一记忆方法。《普通码》“音”和“形”结合的的方法,对部首既有见“形”取码,也有按“音”取码,有的代码需特别强记,缺乏统一规则。
仅以“吴”姓为例,《音码》要从60多个“wu”音字中选择;《五笔字形输入法》的回答是“口一大吴”;《自然码》、《普通码》的回答是“口大吴”;这些显然不符合人们识别汉字的思维方法和习惯。
因而以上备现有方法,或重码多、或规则复杂,不符合人们对汉字的思维和识别习惯,都不甚理想。
本发明的目的是改进现有技术的上述缺陷,设计一种重码少、规则简单易学无需特别强记、符合汉字常规标识思维和习惯的,改进的汉字快捷编码和输入方法,即汉字属性分类码输入法。
本发明的构思是通过如下技术方案实施的提供一种汉字属性分类码输入法,其特征是根据汉字的音、形、意、性进行分类标识的键盘编码系统,主要由(1)以“音”标“形”的部首音码代码系统,(2)以“意”、“性”的属性分类代码标识系统,(3)汉字、词组的编码方法和(4)改进的标准键盘构成。
1.上述的汉字属性分类码输入法,其特征是所述的以“音”标“形”的部首音码代码系统,是指对汉字取两个标识单位。
(1)本发明所述的“标识单位”,既有字典部首也有非字典部首。
①字典部首包括成字部首如“口、马、木、月、八、弓、虫…”等,和非成字部首如“丨、丿、刂、亻、讠、廴、艹、彡、犭、彳…”等;②非字典部首如嗷——第一标识单位“口(部首)”,第二标识单位“敖”(字)。
(2)字的部首,取大不取小,凡能分成两个单位的,不分成更多单位,如蔼——取“艹、谒”,不分“艹、讠、曷”,吴——取“口、天”,不分“口、一、大”,蓓——取“艹、倍”,不分“艹、亻、立、口”。
(3)对于不能以两个部首表示的字,则以首、末两部首为第一、第二标识单位,如倍——第一标识单位是“亻”(首部首),第二标识单位是“口”(末部首),凹——第一标识单位是“丨”(首部首),第二标识单位是“一”(末部首),岸——第一标识单位是“山”(首部首),第二标识单位是“干”(末部首)。
(4)根据字型规则,对汉字以其构成部分的上下、左右、外内为序分别取部首,如帮——第一标识单位是“邦”,第二标识单位是“巾”(上下型),杯——第一标识单位是“木”,第二标识单位是“不”(左右型),闭——第一标识单位是“门”,第二标识单位是“才”(外内型)。
(5)对字或部首标记时用部首音码或第一音码标记。
①音码指汉字或部首的读音编码,含声母和韵母(如张zhang,声母zh+韵母ang),不含声母的只取韵母(如阿a),不含韵母的只取声母(如嗯n)。
②第一音码指汉字(部首)整个音码的首位码(如王wang的首位码w)。
(6)标记时分别用全拼法、简拼法和双拼法标注,以适应使用拼音码中全拼、简拼或双拼的不同习惯。如部首巛(读“川”)——全拼音码chuan,第一音码c;
简拼音码iuj,第一音码i;双拼音码uuf,第一音码u。
2.本发明创建了部首代码系统和属性代码系统(1)部首代码系统(简称部首音码),取部首读声的第一音码为代码,采用以“音”表“形”的统一编码规则,简单好记,无须背诵王码的字根口诀表、自然码的部件代码表、普通码的字根键位表,打破了各种形码不规则编码的束缚,较好地解决了难学难用问题。
①部首代码中成字部首取其第一音码为代码,如口——代码取“k”,马——代码取“m”;②非成字部首取其习惯读音的第一音码为代码,如亻——代码取“r”(人旁),忄——代码取“x”(心旁);宀——代码取“b”(宝头)。
本发明创建的部首代码键盘分布见附表2~4;本发明创建的分类代码键盘分布见附表5。
(2)以“意”、“性”的属性分类代码识别系统(分类码),汉字、词组具备词意和词性,用词意和词性的属性分类码识别汉字和词组,简单明了,直接达意,也是减少重码的有效方法。
(3)根据汉字或词组的“词意”和“词性”分别纳入根据①学科分类,如政治,经济,文化,历史,地理,天文,气象,物理,化学,生物,农业,医药,科技,工业,交通,军事等;②语法分类,如代词,数词,量词,副词,介词,连词,象声词,表色词,表形态,表情,感词等;③实用分类,如姓氏,机构,称谓,食用,衣着等识别划分的属性分类代码识别系统。
(4)分类时取分类名称的读音作为代码,标记时分别用全拼法、简拼法和双拼法标注。如生物——sw或s(全拼代码);uw或u(简拼代码);iw或i(双拼代码)。
3.上述的汉字属性分类码输入法,其特征是所述的汉字、词组的编码方法是(1)单个汉字取其第一标识单位、第二标识单位的部首音码+该汉字的音码构成的部首音码法;(2)或取该字的音码+该字的两位属性代码构成的分类码法。
(3)对不知读音的生僻字取生僻字专用代码键+该字的第一标识单位、第二标识单位的部首音码,
(4)对部首字取部首字专用代码键+该字的音码或部首字专用代码键+该部首的笔画代码,(5)双字词组用分别取两个汉字的第一标识单位、第二标识单位的部首音码相加构成的部首音码法;或对可按属性分类的词组,取两字的第一音码+词组的两位属性分类代码构成的分类码法。
(6)三字词组用分别取三个汉字的第一标识单位的部首音码+词组一位属性分类代码;或对可按属性分类的词组,取三字的第一音码+词组的一位属性分类代码。
(7)四字及四字以上词组用分别取前三个汉字和末字的第一标识单位的部首音码相加构成的部首音码法;或用分别取前三个汉字和末字的第一音码相加构成的音码法,都不加分类代码。
4.上述的汉字属性分类码输入法,其特征是所述的改进的标准键盘是指根据前述规则,分别制备正面标记有部首读音代码,汉语拼音的声母、韵母和标准键盘原位置的英语字母的标签,粘贴在原英语字母键处,成为汉字属性分类码输入法的键盘。键盘上特别设置了生僻字专用代码键和部首字专用代码键,方便地解决了生僻字和部首字的输入问题。
本发明的应用效果令人满意,达到了预期的发明目的。
1.观测指标(1)分辨率 指编码系统对两级字库中汉字的分辨能力。
计算公式分辨率=编码分类数/汉字数×100(2)重码率 指重码字数与总字数的比例。
(3)单码率 指无重码字数与汉字总字数的比例。
计算公式单码率=(100-重码率)×1002.观测结果
以下结合实例和附表对本发明作进一步阐述例一有的汉字用部首音码标识举例单个汉字取其第一标识单位、第二标识单位的部首音码+该汉字的音码构成的部首音码法,如安、按、案、氨、胺、鞍、桉、铵诸重码同音字,因取得的不同部音码而得到完全分辨,如
安——b(宀)+n(女)+an bnan(全拼),bnj(简拼),bnf(双拼);按——t(扌)+a(安)+an taan(全拼),tjj(简拼),tff(双拼);案——a(安)+m(木)+an aman(全拼),jmj(简拼),fmf(双拼);氨——q(气)+a(安)+an qaan(全拼),qjj(简拼),qff(双拼);胺——y(月)+a(安)+an yaan(全拼),yjj(简拼),yff(双拼);鞍——g(革)+a(安)+an gaan(全拼),gjj(简拼),gff(双拼);桉——m(木)+a(安)+an maan(全拼),mjj(简拼),mff(双拼);铵——j(钅)+a(安)+an jaan(全拼),jjj(简拼),jff(双拼)。
例二有的汉字用属性分类码标识举例单个汉字取该字的音码+该字的两位属性代码构成的分类码法,如冯——全拼fengxs 取冯的全拼音码“feng”+分类码“xs”(姓氏);简拼fgxu取冯的简拼音码“fg” +分类码“xu”(姓氏);双拼ftxi取冯的双拼音码“ft” +分类码“xi”(姓氏)。
沪——全拼hudl取沪的全拼音码“hu” +分类码“dl”(地理);简拼hudl取沪的简拼音码“hu” +分类码“dl”(地理);双拼hudl取沪的双拼音码“hu” +分类码“dl”(地理)。
苯——全拼benhx 取苯的全拼音码“ben” +分类码“hx”(化学);简拼bfhx取苯的简拼音码“bf” +分类码“hx”(化学);双拼brhx取苯的双拼音码“br” +分类码“hx”(化学)。
不再考虑字形拆分取码,对于方便输入,加快速度,减少重码,收到良好效果。
例三生僻字标识举例生僻字读音较难掌握,本发明特设生僻字专用代码键“v”。标识时,取生僻字专用代码键+该字的第一标识单位、第二标识单位的部首音码,如鞔(音man)——vgm取生僻字专用代码键“v”+该字的第一标识单位的部首音码“g(革)”+该字的第二标识单位的部首音码“m(免)”;黠(音xia)——vhj取生僻字专用代码键“v”+该字的第一标识单位的部首音码“h(黑)”+该字的第二标识单位的部首音码“j(吉)”。
例四部首字标识举例有的部首字除用区位码外,很难有其他方法输入,本发明另辟蹊径,特设部首字专用代码键“o”。标识时,取部首字专用代码键+该字的音码或部首字专用代码键+该部首的笔画代码,如丿(音撇)——opie取部首字专用代码键“o”+部首字的音码“pie(撇的音码pie)”;或丿(音撇)——oa取部首字专用代码键“o”+该部首的笔画代码“a(一画的代码)”,此时提示行显示“一、丨、丿、乙”供选择。
附表1 笔画代码键举例
……。
例五双音词组用部首音码标识举例双音词组分别取两个汉字的拆分单位作第一标识单位、第二标识单位,它们的部首音码相加,使在拼音法编码同为“zhishi”的重码词组“只是、指使、支使、致使、知事、指示、知识”,按本发明的部首音码标识,得到完全分辨,如只是——kbrp两字的拆分单位k(口)+b(八)+r(日)+p(丿);指使——tzrl两字的拆分单位t(扌)+z(旨)+r(亻)+l(吏);支使——syrl两字的拆分单位s(十)+y(又)+r(亻)+l(吏);致使——zwrl两字的拆分单位z(至)+w(文)+r(亻)+l(吏);知事——ukhs两字的拆分单位s(矢)+k(口)+h(一)+s(丨);指示——tzex两字的拆分单位t(扌)+z(旨)+e(二)+x(小);知识——skyz两字的拆分单位s(矢)+k(口)+y(讠)+z(只)。
例六双音词组用属性分类码标识举例双音词组取两字的第一音码+词组的两位属性代码构成的分类码法,如上海——shdl上海两字的第一音码“sh”+分类码“dl”(地理);一个——yglc一个两字的第一音码“yg”+分类码“lc”(量词);爱情——aqqg爱情两字的第一音码“aq”+分类码“qg”(情感词)。
例七三字词组举例三字词组分别取三个汉字的第一标识单位的部首音码+一位分类代码,如计算机——yzmk三字的部首码y(讠)+z(竹)+m(木)+一位分类码“k(科技)”;或分别取三个汉字的第一音码+一位分类代码,如计算机——jsjk计算机三字的声码“jsj”+一位分类码“k(科技)”;共产党——gcdz共产党三字的声码“gcd”+一位分类码“z(政治)”。
例八四字及四字以上词组举例四字及四字以上词组,分别取四个汉字的第一标识单位的部首音码,如中华民族——khzf四字的部首码k(口)+h(化)+z(乙——读折zhe)+f(方);中央委员会——kphr前三字和末字的部首码k(口)+p(丿)+h(禾)+r(人);或取前三个和末位汉字的第一音码,如中华民族——zhmz“中华民族”四字的声母;中央委员会——zywh前三字“中央委”和末字“会”的声母。
例九改进的标准键盘,在原键位增加部首键名,键位仍按原标准键盘次序排列。
附表2~4分别按全拼、简拼、双拼提供了三种部首代码键盘举例。
附表5提供了分类代码键盘举例。
B 卜八勹宀比贝疒白
鼻 O [部首字专用代码键]C 寸艹采隹厂彳屮巛车臣虫赤辰 P 丿攴片爿疋皮D 丶刂刀大斗歹豆 Q 犭犬气欠青其E 二卩阝廾耳儿R 人亻日F 方父风缶S 厶氵彡纟四
丨十士山饣尸水手殳礻示石矢舌豕G 亠冖广工弓戈瓜艮谷革骨鬼 身食鼠H 一灬火户禾黑T 冂扌土田夂J 几巾己见斤钅臼戋角金V [生擗字专用代码键]K 匚凵口 W 囗文王韦瓦攵L 冫力立龙来老囟里鹿X 小夕彐心忄肀穴西血辛M 门马木毛母目皿矛米麦黾麻皿毛麦木目母Y 讠又尢弋幺礻示日月衤业用衣羊页羽言酉西鱼音N 女牛鸟 Z 廴辶子自走足乙爪竹舟豸齿止附表2
全拼法部首代码键盘分布
A(zh) Z爪竹舟豸齿止 O [部首字专用代码健]B 卜八勹宀比贝疒白
鼻P 丿攴片爿疋皮C 寸艹采隹 Q 犭犬气欠青其D 丶刂刀大斗歹豆R 人亻日E 二卩 阝廾耳儿 S 厶氵彡纟四
F 方父风缶 T 冂扌土田夂G 亠冖广工弓戈瓜艮谷革骨鬼 U(sh) 丨十士山饣尸水手殳礻示石矢舌豕身食鼠H 一灬火户禾黑 V [生擗字专用代码键]I(ch) 厂彳屮巛车臣虫赤辰W 囗文王韦瓦攵J 几巾己见斤钅臼戋角金 X 小夕彐心忄肀穴西血辛K 匚 凵口 Y 讠又尢弋幺礻示日月衤业用衣羊页羽言酉L 冫力立龙来老囟里鹿西鱼音M 门马木毛母目皿矛米麦黾麻皿毛麦木目母 Z 廴辶子自走足N 女牛鸟附表3简拼法部首代码键盘分布
A(zh) Z爪竹舟豸齿止 O [部首字专用代码键]B 卜八勹宀比贝疒白
鼻 P 丿攴片爿疋皮C 寸艹采隹Q 犭犬气欠青其D 丶刂刀大斗歹豆 R 人亻日E 二卩 阝廾耳儿 S 厶氵彡纟四
F 方父风缶T 冂扌土田夂G 亠冖广工弓戈瓜艮谷革骨鬼U(ch) 厂彳屮巛车臣虫赤辰H 一灬火户禾黑V [生擗字专用代码健]I(sb) 丨十士山饣尸水手殳礻示石矢舌豕身食鼠W 囗文王韦瓦攵J 几巾己见斤钅臼戋角金X 小夕彐心忄肀穴西血辛K 匚凵口 Y 讠又尢弋幺礻示日月衤业用衣羊页L 冫力立龙来老囟里鹿 羽言酉西鱼音M 门马术毛母目皿矛米麦黾麻皿毛麦木目母Z 廴辶子自走足N 女牛鸟附表4双拼法部首代码键盘分布
A 政治类、[表]状态词、助词、指示代词、[表]重复词 M (草)木类、[表]命令词B 部门机构类 N 农业类、鸟类C 财经类、[表]存在变化词 P [表]判断词D 地理类、[表]动作词、大(写数)字 Q 气象类、[表]趋向词、[表]情感、心理活动词F 房建类、[表]方位词、[表]范围词、[表]否定词 R 人名类、人称代词G 工矿类 S [表]色词H 化学类、花类、[表}环境词 T 天文类、体育运动类、叹词、特殊代词I 虫类、称谓类、[表]程度词 U 数学类、(饮)食类、数(序)词、[表]时间词J 军事类、计算机类、交通运输类、介词 W 文教类、物理类K 科学技术类、[表]可能、意愿词、[表]肯定词 X 姓氏类、虚词、[表]行为动作词、[表]性质词L 历史类、量词、连词 Y 医药类、鱼类、衣着类、疑问代词附表5
分类代码键盘分布
权利要求
1.一种汉字属性分类码输入法,其特征是根据汉字的音、形、意、性进行分类标识的键盘代码系统,主要由(1)以“音”标“形”的部首音码代码系统,(2)以“意”、“性”的属性分类代码标识系统,(3)汉字、词组的编码方法,和(4)改进的标准键盘构成。
2.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的以“音”标“形”的部首音码代码系统,是指对汉字取两个标识单位,以其部首音码或第一音码为标记,字的部首,取大不取小,凡能分成两个单位的,不分成更多单位,对于不能以两个部首表示的字,则以首、末两部首为第一、第二标识单位,用部首音码或第一音码标记,标记时分别用全拼法、简拼法和双拼法标注。
3.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的以“意”、“性”的属性分类代码识别系统,是指根据汉字或词组的“词意”和“词性”分别纳入根据学科分类、语法分类和实用分类划分的属性分类代码识别系统,分类时取分类名称的音码作为代码,标记时分别用全拼法、简拼法和双拼法标注。
4.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的汉字、词组的编码方法是指对GB-23l2(80)中全部汉字和常用词组的编码方法,其中单个汉字取其第一标识单位、第二标识单位的部首音码+该汉字的音码构成的部首音码法,或取该字的音码+该字的属性代码构成的分类码法,生僻字取生僻字专用代码键+该字的第一标识单位、第二标识单位的部首音码,部首字取部首字专用代码键+该字的音码或部首字专用代码键+该部首的笔画代码,双字词组用分别取两个汉字的第一标识单位、第二标识单位的部首音码相加构成的部首音码法,或对可按属性分类的词组,取两字的第一音码+词组的两位属性分类代码构成的分类码法,三字词组用分别取三个汉字的第一标识单位的部首音码+词组一位属性分类代码,或对可按属性分类的词组,取三字的第一音码+词组的一位属性分类代码构成的分类码法,四字及四字以上词组用分别取前三个汉字和末字的第一标识单位的部首音码相加构成的部首音码法,或用分别取前三个汉字和末字的第一音码相加构成的音码法,都不加分类代码。
5.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的改进的标准键盘是指根据前述规则,分别制备正面标记有部首读音代码,汉语拼音的声母、韵母和标准键盘原位置的英语字母的标签,粘贴在原英语字母键处,成为汉字属性分类码输入法的键盘。
全文摘要
一种汉字属性分类码输入法,根据汉字的音、形、意、性进行分类标识的键盘代码系统,系由以“音”标“形”的部首音码代码系统,以“意”、“性”的属性分类代码识别系统,汉字、词组的编码方法和改进的标准键盘构成。尤其在键盘中设立生僻字专用代码键和部首专用代码键,方便地解决了生僻字和部首字的输入。适用于各类中文信息处理系统。提供的快捷编码和输入方法,重码少、规则简易无需特别强记、符合汉字常规标识思维和习惯。
文档编号G06F3/023GK1229206SQ9811010
公开日1999年9月22日 申请日期1998年3月15日 优先权日1998年3月15日
发明者潘承荣 申请人:潘承荣
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1