音笔类主副码字母型部首字典、声系字典汉字编码输入法及其键盘的制作方法

文档序号:9523742阅读:561来源:国知局
音笔类主副码字母型部首字典、声系字典汉字编码输入法及其键盘的制作方法
【技术领域】
[0001] 本发明属于用于计算机或其他对汉字字符信息进行处理装置的汉字编码输入的 方法及键盘。
【背景技术】
[0002] 已公开的汉字编码输入方法,还没有较好的简洁快捷的用于部首字典、声系字典 的汉字输入和检索的汉字编码输入方法,还没有一种输入方法能把相同部首的字,相同声 旁的字汇集在一起,便于使用者使用。
[0003] 发明目的
[0004] 本发明的目的是提出一种在对化03112606. 5 -类音形义汉字编码输入法进行 改进的基础上的使使用者对方法的掌握更容易的,音笔类主副码字母型部首字典、声系字 典汉字编码输入法,编码部件的安排也更合理,字的重码率也控制得较低,字的输入也很流 畅,大大方便对电子版部首字典、声系字典的形成与应用。

【发明内容】

[0005] -个汉字有几种拆分方案,则依次优先满足(1)取拆分成编码部件最少的郝一 种;(2)取拆分编码部件笔画多的在先的郝一种,或者采用另一种方案,取拆分编码部件笔 画少的在先的郝一种;(3)取编码部件起笔画的笔画排序在前的郝一种,确定一种拆分方 案;
[0006] 除满足上述拆分要求外,本发明采用下述两种汉字拆分方案,方案之一,称之为部 首拆分法;根据GF0011-2009《汉字部首表》规定W及在该规范W前的字典、词典规定的 部首取汉字部首,采用GF0012- 2009《GB13000. 1字符集汉字部首归部规范》的汉字部首 归部规则,①从汉字的左、上、外位置取部首,如果左和右、上和下、外和内都是部首,则只取 左、上、外位置的部首;②如果汉字的左、上不是部首,右、下是部首,则取右、下位置的部首; 半包围结构的字,如果外不是部首,内是部首,则取内;⑨如果汉字的左和右、上和下都不是 部首,则按照先左后右、先上后下的顺序,从偏旁的位置取部首;④如果由上述位置取不到 部首的左右结构、上下结构、包围结构的字或其他字,从起笔的位置取单笔部首;⑤如果在 取部位置上少笔与多笔几个部首出现叠合时,则取多笔部首,不取少笔部首;根据上述规 则取的部首,在把汉字分成首部与余部两个部分中,把上述的部首一律都作为首部,一般来 说,汉字去掉首部剩余部分为余部,但是对于只能取单笔部首的单个的非部首的编码部件 的汉字,为了保持编码部件的完整性,该汉字的送个编码部件的整个编码部件作为该汉字 的余部,例如,"重"字是单个编码部件的汉字,"重"的部首是"i","重"的余部是"重",对 于单个编码部件的汉字本身是部首的不再拆分;此方案中的汉字余部,还是依据汉字去掉 首部后的笔画顺序对各编码部件取编码;方案之二,称之为声符拆分法,大部分汉字都是形 声字,由声符与形符构成,声符也称为声旁,声符相同的汉字形成了字族,W字族汇集在一 起形成的字典称为声系字典,形符也称为形旁,为此把汉字分成声符与形符两部分,w《广 韵声系》为藍本,W《广韵声系》确定的声符,作为汉字声符部分,汉字去掉声符部分剩余的 部分就视为汉字的形符,如果《广韵声系》没有确定汉字声符的,而汉字能明确确定部首的, 汉字去掉部首的剩余部分,就视为声符,送里的部首也就视为形符,汉字中有如下几个编码 部件组合:<<贏"、"f^"、"件构成汉字族,为此也定义为声符,汉字去掉 送些编码部件组合的剩余部分就是形符,对于单个编码部件,不再拆分,整个编码部件视作 声符,把汉字的声符作为拆分汉字的第一部分,汉字的形符作为拆分汉字的第二部分;
[0007] 本发明利用计算机的字母键盘手机等其他对汉字字符信息进行处理装置的软、硬 字母键盘,进行编码输入汉字。具体的实现步骤如下:
[0008] 一、选定编码部件
[0009] 根据国家语委GF3001--1997《信息处理用GB13000. 1字符集汉字部件规范》的 要求,拆分汉字,确定参与编码的编码部件。
[0010] 选用GF3001--19W《信息处理用GB13000. 1字符集汉字部件规范》的560个基础 部件,选用GB0011--2009《汉字部首表》的201个主部首和100个附形部首,再选用含有 560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、 贯、亀、龜、庚、亥、壺、華、亦一扣、与、否、堇、兼、可、宴、免、卯、南、囊、农、4、棄、牽、其、妻、 前、乌、烏、勿、网、行、段、義、胤、W、制,共计44个,为了便于记忆使常用的数字类汉字与字 符都定为编码部件又选用了:一、百、六、〇,扣除重复计算数,总计选用了 687个部件作为 本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或 写法稍异、或有所省减、或置向不同的变体、或互为繁、简字等关联性,归并成409个编码部 件组,组内的第一个编码部件称为主形编码部件,有的编码部件由多个基础部件组成,如; 風,在编码时要把它整体看作一个编码基本单元--编码部件。在不违反GF3001规范的 前提下,在送687个编码部件基础上允许增、减百分之二十的编码部件选用量,只对重码率 略有影响,但不改变该编码输入法的实质。
[0011] 二、确定高频编码部件及其主部位位置W及高频编码部件的字母型主码
[0012] 构成汉字的五六百个部件中有Η十多个被称之为部首的部件构字能力特别强,据 本人统计它们大约构成了全部汉字的百分之四十左右,在送Η十多个部首中,本发明确定 了其中的31个构字能力特别强的部首为高频编码部件,在本发明确定的687个编码部件中 除去31个高频编码部件其余的编码部件称之为普通编码部件。
[0013] 为了降低重码率,在同一字母键位上只设置一个或一组互为繁、简字体的高频编 码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通 常所处的位置,为了降低重码率,其中高频编码部件:山、手、g、乡、系、月、月Μ、木、*、 言、七等9个编码部件组的12个高频编码部件不是W它们的读音或部首名称的汉语拼音的 首字母作为它们的主码,而是人为指定。确定的31个高频编码部件的形状、字母型主码、主 部位位置如表一所示;表一:
[0014]
[0015] 31个高频编码部件在字母键盘盘面的布置如图一所示。
[0016] 上述31个高频编码部件W及字母型主码的设定,其数量与字母型主码的设定可 W在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质。
[0017]H、确定每个编码部件的音笔类主码、副码1、副码2、副码3,形成汉字
[0018] 编码方法的音笔类编码资源
[0019] 选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之 为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部 件都有一定的读音或叫法,除高频编码部件的主码已确定了W外,其他主形编码部件的主 码一般都取其读音或叫法名称的拼音首个字母作为音笔类的字母型主码。为了降低重码 率,一个改进的方案,称之为点折I法:主形编码部件的读音的拼音首个字母为Y的,而且 主形编码部件的首笔是点(、)、折(^ )的取I作为其字母型主码,首笔为横(一)、竖 (I)、撇(i)的取Y作为其字母型主码;另一种方案,称之为点折Y法,主形编码部件的 读音的拼音首个字母为Y的而主形编码部件的首笔是点(、)、折(^)的仍取Y作为其字 母型主码,首笔为横(一)、竖(I)、撇(i)的取I作为其字母型主码;除此之外其他的 普通编码部件的主形编码部件的主码仍取其读音或叫法的拼音首个字母作为音笔类的字 母型主码。
[0020] 根据国家规范,汉字由横(一)、竖(I)、撇(i)、点(、)折(^ )五种笔画组 成,本发明依次用送五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示。每个编码部 件依次取首笔画、第2笔画、第3笔画的笔画的字母型码作为编码部件的第1笔画字母型副 码、第2笔画字母型副码、第3笔画字母型副码;对于不足3个笔画构成的编码部件,缺失的 第2笔画、第3笔画,取第2笔画副码、第3笔画副码的一个取码方案是,可W任意各确定一 个字母来表达,本发明确定都取字母V;另一个方案是,对于不足3个笔画构成的编码部件, 缺失的第2笔画、第3笔画的,都不取任何字母型副码。
[0021] 根据上述方法确定本发明的409个编码部件组的687个编码部件的字母型主码、 第1、第2、第3笔画码,把笔画码相应称为副码1、副码2、副码3,依次排列,如表二所示,对 于不足3个笔画构成的编码部件,缺失的第2笔画、第3笔画,确定都采用字母V补足的方 案;主形编码部件的读音的拼音首个字母为Y的,采用点折I法;表二中音笔类主副码,为 了看得醒目采用了大写字母,它与小写字母等效,在实际编码时,编码表采用小写字母;表
[0022]
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1