组合式音笔类主副码汉字、词语编码输入法及其键盘的制作方法

文档序号:9546718阅读:359来源:国知局
组合式音笔类主副码汉字、词语编码输入法及其键盘的制作方法
【技术领域】
[0001] 本发明属于用于计算机或其他对汉字字符信息进行处理装置的汉字、词语编码输 入的方法及键盘。
【背景技术】
[0002] 已公开的汉字编码输入方法,对于参与编码的部件,一般只赋于一个字母的音码 或形码,本人发明的ZL03112606. 5的一类音形义汉字编码输入法,引入了音、形码与义类 码形成了重码率低见字就能输入的较好的计算机汉字输入方法,取得了良好的效果。但是 要求使用者要对四百多个编码部件组的义类码要了解记住掌握,有一定的难度,需要一定 的时间。
[0003] 发明目的
[0004] 本发明的目的是提出对ZL03112606. 5 -类音形义汉字编码输入法进行改进的音 笔类汉字、词语编码输入法,使使用者对方法的掌握更容易,编码部件的安排也更合理,重 码率也控制得较低,字、词的输入也流畅。

【发明内容】

[0005] -个汉字有几种拆分方案,则依次优先满足(1)取拆分成编码部件最少的那一 种;(2)取拆分编码部件笔画多的在先的那一种,或者采用另一种方案,取拆分编码部件笔 画少的在先的那一种;(3)取编码部件起笔画的笔画排序在前的那一种,确定一种拆分方 案;
[0006] 除满足上述拆分要求外,本发明有两种汉字拆分法,方案之一,称之为通用拆分 法,两个以上编码部件构成的汉字,可以分成首部与余部两部分,规定,在上下结构或左右 结构、包围类结构的汉字中,只要首个编码部件处于单独位置或者首个编码部件与末个编 码部件都为单独的编码部件时,都确定首个编码部件作为汉字分成两个部分中的首部,汉 字去掉该编码部件后剩余的编码部件就为余部,例如:"蒂"字"#"为首部,"帝"为余部; "國"字"口 "为首部,"或"为余部;又规定,汉字的第1编码部件与一个或一个以上的编码 部件处在一个层面,则末个编码部件为余部,汉字去掉余部的剩余的多个编码部件的组合, 称作组合首部,例如:"愁"字,"秋"为组合首部;为了减少重码率,还可以把"ft定 义为组合部件,在汉字拆分中视作一个组合首部,例如"赢"字,"麗"为一个部分,视作组合 首部,"贝"为另一部分,视为余部;向右上包围结构的字,例如以为部首的汉字, 其除去以外的为一个部分,视为组合首部,为另一部分,为单余部;方 案之二,称之为部首拆分法:根据GF0011- 2009《汉字部首表》规定以及在该规范以前的 字典、词典规定的部首取汉字部首,采用GF0012- 2009《GB13000. 1字符集汉字部首归部 规范》的汉字部首归部规则,①从汉字的左、上、外位置取部首,如果左和右、上和下、外和内 都是部首,则只取左、上、外位置的部首;②如果汉字的左、上不是部首,右、下是部首。则取 右、下位置的部首;半包围结构的字,如果外不是部首,内是部首,则取内;③如果汉字的左 和右、上和下都不是部首,则按照先左后右、先上后下的顺序,从偏旁的位置取部首;④如果 由上述位置取不到部首的左右结构、上下结构、包围结构的字或其他字,从起笔的位置取单 笔部首;⑤如果在取部位置上少笔与多笔几个部首出现叠合时,则取多笔部首,不取少笔部 首;根据上述规则取的部首,在把汉字分成首部与余部两个部分中一律都作为首部,一般来 说,汉字去掉首部剩余部分为余部,但是对于只能取单笔部首的单个编码部件的汉字,为了 保持编码部件的完整性,该汉字的这个编码部件的整个编码部件作为该汉字的余部,例如, "重"字是单个编码部件的汉字,"重"的部首是" j ","重"的余部是"重";对于单个编码部 件的汉字本身是部首的不再拆分;此方案中的汉字余部,还是依据汉字去掉首部后的笔画 顺序对各编码部件取码;
[0007] 本发明利用计算机的字母键盘、数字键盘或手机等其他对汉字字符信息进行处理 装置的软、硬字母键盘、数字键盘,进行编码输入汉字、词语。具体的实现步骤如下:
[0008] 一、选定编码部件
[0009] 根据国家语委GF3001--1997《信息处理用GB13000. 1字符集汉字部件规范》的 要求,拆分汉字,确定参与编码的编码部件。
[0010] 选用GF3001--1997《信息处理用GB13000. 1字符集汉字部件规范》的560个 基础部件,选用GB0011--2009《汉字部首表》的201个主部首和100个附形部首,再选 用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、 段、发、贯、亀、龜、庚、亥、壺、華、亦、办、、与、、堇、兼、可、婁、免、卯、南、囊、农、4、 、棄、牽、其、妻、前、乌、烏、勿、网、行、段、羲、._ ,、以、制,共计44个,为了便于记忆使常用 的数字类汉字与字符都定为编码部件又选用了:一、百、六、?,扣除重复计算数,总计选用 了 687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件 的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字等关联性, 归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,有的编码部件由多 个基础部件组成,如:風,在编码时要把它整体看作一个编码基本单元--编码部件。在 不违反GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编码部 件选用量,只对重码率略有影响,但不改变该编码输入法的实质。
[0011] 二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码
[0012] 构成汉字的五六百个部件中有三十多个被称之为部首的部件构字能力特别强,据 本人统计它们大约构成了全部汉字的百分之四十左右,在这三十多个部首中,本发明确定 了其中的31个构字能力特别强的部首为高频编码部件,在本发明确定的687个编码部件中 除去31个高频编码部件其余的编码部件称之为普通编码部件。
[0013] 为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编 码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通 常所处的位置,为了降低重码率,其中高频编码部件:山、夺、£、乡、系、月、、木、*、 I、i等9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的 首字母作为它们的主码,而是本发明人人为指定。确定的31个高频编码部件的形状、字母 型主码、主部位位置如表一所不:表一:
[0014]
[0015] 31个高频编码部件在字母键盘盘面的布置如图1所示。
[0016] 上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可 以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质。
[0017] 三、确定每个编码部件的音笔类主码、副码1、副码2、副码3,形成汉字
[0018] 编码方法的音笔类编码资源
[0019] 选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之 为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部 件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主 码一般都取其读音或叫法名称的拼音首个字母作为音笔类的字母型主码。为了降低重码 率,一个改进的方案,称之为点折I法:主形编码部件的读音的拼音首个字母为Y的,而且 主形编码部件的首笔是点(、)、折(1)的取I作为其字母型主码,首笔为横(一)、坚 (丨)、撇(j )的取Y作为其字母型主码;另一种方案,称之为点折Y法,主形编码部件的 读音的拼音首个字母为Y的而主形编码部件的首笔是点(、)、折(1)的仍取Y作为其字 母型主码,首笔为横(一)、坚(丨)、撇(j )的取I作为其字母型主码;除此之外其他的 普通编码部件的主形编码部件的主码仍取其读音或叫法的拼音首个字母作为音笔类的字 母型主码。
[0020] 根据国家规范,汉字由横(一)、坚(丨)、撇(j )、点(、)折(1)五种笔画组 成,本发明依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示。每个编码部 件依次取首笔画、第2笔画、第3笔画的笔画的字母型码作为编码部件的第1笔画字母型副 码、第2笔画字母型副码、第3笔画字母型副码;对于不足3个笔画构成的编码部件,缺失的 第2笔画、第3笔画,取第2笔画副码、第3笔画副码的一个取码方案是,可以任意各确定一 个字母来表达,本发明确定都取字母V ;另一个方案是,对于不足3个笔画构成的编码部件, 缺失的第2笔画、第3笔画的,都不取任何字母型副码。
[0021] 根据上述方法确定本发明的409个编码部件组的687个编码部件的字母型主码、 第1、第2、第3笔画码,把笔画码相应称为副码1、副码2、副码3,依次排列,如表二所示,对 于不足3个笔画构成的编码部件,缺失的第2笔画、第3笔画,确定都采用字母V补足的方 案;主形编码部件的读音的拼音首个字母为Y的,采用点折I法;表二中音笔类主副码,为 了看得醒目采用了大写字母,它与小写字母等效,在实际编码时,编码表采用小写字母;表
[0022]







[0030] 四、转换取得各编码部件音笔类数字型主码、副码1、副码2、副码3码,形成音笔 类数字型编码资源
[0031] 转换形成数字型编码资源方案:转换形成数字型编码资源有两种方案,方案之一: 根据国家标准GB/T18031- 2000《信息技术数字键盘汉字输入通用要求》,对编码部件音笔 类字母型的副码1、副码2、副码3涉及到五类笔画的,都以该标准的"汉字笔画的键位设定" 的规定转换成数字码,而不是以笔画名称的汉语拼音首字母转换成相应的数字码,除上述 情况以外,编码部件的各类字母型主码以及拼音首字母等的其他字母,以该标准的"10键 位汉语拼音字母键位设定"和"8键位汉语拼音字母键位设定"的规定的字母与数字的对应 关系,分别依次转换成10键位法音笔类数字型主码、副码1、副码2、副码3与8键位音笔类 数字型主码、副码1、副码2、副码3以及拼音首字母的数字码;对于高频编码部件,在上述转 换所得的各类数字型主、副代码的基础上,略作调整使各高频编码部件的各类数字型主、副 码1的数字组合,在同一类型中相互间都不相同,具体方案如表六所示;上述转换方案称之 为字母笔画不同式转换方案;方案之二,与方案之一不同点在于涉及到"8键位汉语拼音字 母键位设定"的字母型码转换数字型码,对于笔画的转换,把笔画撇" j "的拼音首字母转换 定为数字1,其他不变,仍然以笔画名称的汉语拼音首字母的字母形式,依据标准的规定转 换成数字码,也就是说,只依据GB/T18031标准的" 10键位汉语拼音字母键位设定"和"8键 位汉语拼音字母键位设定"的字母与数字的对应关系,把前面设定的各编码部件各类字母 型主码、副码1、副码2、副码3 -一对应地分别转换成10键位法与8键位法音笔类数字型 主码、副码1、副码2、副码3,对于高频编码部件在上述转换所得的数字型代码的基础上,略 作调整使各高频编码部件的各类数字型主码、副码1的数字组合,在同一类型中相互间都 不相同,具体方案如表七所示,上述转换方案称之为全字母式转换方案;"汉字笔画的键位 设定"如下表三所示 :
[0034] " 10键位汉语拼音字母键位设定"如下表四所示:
[0037] "8键位汉语拼音字母键位设定"如下表五所示:
[0040] "字母笔画不同式转换方案"的高频编码部件的音笔类数字型主码、副码1、副码2、 副码3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的高频编码部件音 笔类数字型主副码,具体方案如表六所示:表六:

[0043] "全字母式转换方案"的高频编码部件的音笔类数字型主码、副码1、副码2、副码 3,用数字键盘的相应的数字键依次表达,31个高频编码部件方案的高频编码部件音笔类数 字型主副码,具体方案如表七所示:表七:
[0044]
[0045] 五、组合式音笔类主副码汉字、词语编码输入法
[0046] 在实施编码时,首先要确定拆分方案,音笔类部首主副字母型汉字编码方法采用 字典、词典用汉字部首拆分法,其余的各种汉字、词语编码方法都采用通用拆分法,在取拆 分编码部件笔画多的在先的那一种与取拆分编码部件笔画少的在先的那一种,这两种方案 中确定一种;在由字母码转换成数字码的两种方案:字母笔画不同式转换方案与全字母式 转换方案,这两方案中确定一种;而且在" 10键位汉语拼音字母键位设定"与"8键位汉语 拼音字母键位设定",这两种规定的字母与数字的对应关系中,确定一种;
[0047] 组合式音笔类主副码汉字、词语编码输入法由组合式音笔类主副码字母型汉字、 词语编码输入法和组合式音笔类主副码数字型汉字、词语编码输入法两部分组成;
[0048] 第一部分组合式音笔类主副码字母型汉字、词语编码输入法
[0049] 利用音笔类字母型编码资源,形成组合式音笔类主副码字母型汉字、词语编码输 入法包含有:①音笔类拼音首字母主副码字母型汉字编码方法;②音笔类拼音首字母主副 码字母型词语编码方法;③音笔类非拼音首字母主副码字母型汉字编码方法;④音笔类非 拼音首字母主副码词语编码方法;⑤音笔类主副码字母型部首汉字编码方法;针对GB2312 的6763个常用汉字、常用词语(或汉语大词语集)和GB18030的27000多汉字字符集或者 GB13000中的中文台湾地区通行的汉字集或者日文汉字集或者朝鲜语汉字集以及几万乃至 10万多汉字的大字符集的汉字的编码输入,可以从以下的方式进行组合编码输入操作:对 常用汉字,例如,GB2312的6763个汉字中的一级字库或者一级、二级字库与常用词语库, 采用音笔类拼音首字母字母型汉字编码方法、音笔类拼音首字母字母型词语编码输入法, 对于GB18030-2000的27000多汉字或者GB13000中的中文台湾地区通行的汉字集或者日 文汉字集采用音笔类非拼音首字母主副码字母型汉字编码方法或者采用音笔类主副码部 首字母型汉字编码方法,取得编码;对于常用词语也可用音笔类非拼音首字母字母型词语 编码方法输入;音笔类拼音首字母字母型汉字编码方法的编码、音笔类拼音首字母字母型 词语编码方法的编码与音笔类非拼音首字母字母型汉字编码方法的编码或者音笔类主副 码字母型部首汉字编码方法的编码的编码,可以组合在同一张码表,也可以分列在不同码 表中,切换调用;音笔类拼音首字母字母型汉字、词语编码与音笔类非拼音首字母字母型汉 字、词语编码可以组合在同一张码表,也可以分列在两张码表中,切换调用。音笔类主副码 字母型部首汉字编码方法还可单列用于电子部首字典,能把部首相同的字汇集在一起;
[0050] 音笔类字母型汉字、词语的编码方法如下:
[0051] 在以下的叙述中,规定:对一个编码部件取1码,即取其字母型主码,取2码,即依 次取其字母型主码、副码1,取3码,即依次取其字母型主码、副码1、副码2 ;取4码,即依次 取其字母型主码、副码1、副码2、副码3。
[0052] ( -)音笔类拼音首字母主副码字母型汉字编码方法
[0053] A、码长不定,最大码长设定为4 ;与大于码长的词语编码同组码表时,汉字编码没 达到码长的,可以以结束键结束,也可以以显示框中冠以的数字选择键选择;有重码的选择 键选择;有多种编码方案的,除另有规定的,都从中选择一种;上述两点适用于下面的各个 方法;确定采用音笔类字母型编码资源;
[0054] B、单个编码部件的汉字的编码:如果该汉字的拼音首字母与该编码部件的字母型 主码相同:对于是高频编码部件的,则依次取该编码部件的字母型主码、副码1 ;对于是普 通编码部件的,有两种编码方案,方案之一,称之为三码法,则依次取该编码部件的字母型 主码、副码1、副码2,方案之二,称之为四码法,依次取该编码部件的字母型主码、副码1、 副码2、副码3 ;如果该汉字的拼音首字母与该编码部件的字母型主码不相同的,又是高频 编码部件的,有五种编码码方案,方案之一,称之为二码法,则依次取该字的拼音首字母、该 高频编码部件的字母型主码,方案之二,称之为三码法,则依次取该汉字的拼音首字母、该 高频编码部件的二个字母型码,方案之三,称之为替代三码法,则依次取该汉字的拼音首字 母、该高频编码部件的副码1、副码2,方案之四,称之为四码法,则依次取该汉字的拼音首 字
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1