一种汉字笔形编码方法

文档序号:6597233阅读:442来源:国知局
专利名称:一种汉字笔形编码方法
技术领域
本发明属于计算机汉字信息处理汉字笔形编码技术。
目前常见的汉字编码方案(形码)多以汉字字元为编码的基本单元,而且有些字元和人们一般理解上的偏旁部首有所不同,是编码方案的设计者自行定义的,因此,这些编码方案必须经过专门的训练和死记硬背编码方案设计者选和定义一个“字元集合”,这给使用的人带来诸多不便。
本发明的目的是试图设计一种新的汉字编码方案,使用户无需死记硬背很多字元,也无需经过专门的培训,即可很方便的使用该汉字编码方案向计算机输入汉字,而且每个汉字的编码都尽可能短。
本发明的内容是1.
(1).将汉字的横(一)、(丨)、撇(丿)、点(丶)、折(乙)五种笔形顺次标记为1、2、3、4、5;将这5种笔形两两组合形成11,12,13,14,15;21,22……53,54,55等5组共25个双笔形组合码;将这5种笔形分别冠以0做为前缀形成01,02,03,04,05的单笔形组合码;
(2).将上述5组双笔形组合码和1组单笔形组合码按下列规律分配到国际标准打字机键盘的30个键位上05 04 03 02 01 51 52 53 53 55Q W E R T Y U I O P45 44 43 42 41 31 32 33 34 35A S D F G H J K L ;
25 24 23 22 21 11 12 13 14 15Z X C V B N M , . /
(3).对汉字的编码方法如下①.四笔划以下的汉字直接取笔形编码;
②.独体字取起始两笔的双笔形组合码和结尾(收笔)笔形的单笔形组合码;
③.一般汉字取首字元和尾字元的双笔形组合码,字元的双笔形组合码是其起始两笔的双笔形组合码;
2.本发明人注意到,完全按上述方法完成对汉字的编码时,有些键位的载码量很大,而另一些键位的载码量很小,这种情况会导致降低输入速度,为了解决这个问题,本发明选择了最常见的、组字能力最强、在汉字中出现频率很高的25个偏旁部首,按(1).将‘扌’,‘氵’等25个部首字元分配到国际标准打字机键盘的20个键位上扌 氵 亻 木 艹 月 日 辶Q W E R T Y U I O P广 疒 心 钅 犭 A S D F G H J K L ;
山巾 目贝 虫足 口 土 讠 鱼鸟Z X C V B N M , . /(2).在对汉字进行编码时,遇到上述部首字元,则直接取其所在键位,而不是其起始两笔的双笔形组合码。
3.由于本发明大大的减少了用户的记忆量,每个汉字的编码也仅有两位,重码率相对于其它汉字编码方案(形码)有所提高,为了进一步提高输入速度,本发明在发生重码时所有重码字按使用频度高低排序,第一个重码字的编码可用该字的编码加空格,第二个重码字为该字的编码将第二个码重复一次,第三个重码字为该字的编码将第二个码重复两次。
据统计,词汇在中文信息处理中覆盖率达70%以上,因而词汇编码对提高汉字输入速度有重大的意义。
4.本发明在对词组进行编码时,对于(1).双字词,将各个单字的编码拼在一起;
(2).三字词,取各单字的第一码加空格;
(3).四字词,取各单字的第一码;
(4).多于四字的词,取前三个字和最后一个字的第一码。
本发明的优点由于本发明仅用了25个最常见的偏旁部首,而对汉字的编码取字元起始两笔的双笔形组合码,记忆量小,能够按笔划顺序正确书写汉字的人都能使用而无需专门的培训。
权利要求
1.一种汉字笔形编码方法,其特征在于(1).将汉字的横(一)、(|)、撇(丿)、点(丶)、折(乙)五种笔形顺次标记为1、2、3、4、5;将这5种笔形两两组合形成11,12,13,14,15;21,22……53,54,55等5组共25个双笔形组合码;将这5种笔形分别冠以0做前缀,形成01,02,03,04,05的单笔形组合码;(2).将上述5组双笔形组合码和1组单笔形组合码按下列规律分配到国际标准打字机键盘的30个键位上。05 04 03 02 0151 52 53 53 55Q W ER T YU I O P45 44 43 42 4131 32 33 34 35A S D F G H J K L ;25 24 23 22 21 11 12 13 14 15Z X C V B N M , . /(3).对汉字的编码方法如下①.四笔划以下的汉字直接取笔形编码;②.独体字取起始两笔的双笔形组合码和结尾(收笔)笔形的单笔形组合码;③.一般汉字取首字元和尾字元的双笔形组合码,字元的双笔形组合码是其起始两笔的双笔形组合码。
2.如权利要求1所述的汉字笔形编码方法,其特征在于(1).将‘扌’,‘氵’等25个部首字元分配到国际标准打字机键盘的20个键位上。扌 氵 亻 木 艹 月 日 辶Q W E R T Y U I O P广 疒 心 钅 犭 A S D F G H J K L ;山巾 目贝 虫足 口 土 讠 鱼鸟Z X C V B N M , . /(2).在对汉字进行编码时,遇到上述部首字元,则直接取其所在键位,而不是其起始两笔的双笔形组合码。
3.如权利要求1、2所述的汉字笔形编码方法,其特征在于在发生重码时,所有重码字按使用频度高低排序,第一个重码字的编码可用该字的编码加空格,第二个重码字为该字的编码将第二个码重复一次,第三个重码字为该字的编码将第二个码重复两次;
4.如权利要求3所述的汉字笔形编码方法,其特征在于(1).双字词,将各个单字的编码拼在一起;(2).三字词,取各单字的第一码加空格;(3).四字词,取各单字的第一码;(4).多于四字的词,取前三个字和最后一个字的第一码。
全文摘要
本发明为用户提供了一种简易的编码方法,它以计算机键盘30个常用键作为汉字输入的基本编码单元,按指法操作规则确定组位码,并与5种基本笔形和25种双笔形组合的代码相对应。由于本发明仅用了25个最常见的偏旁部首,而对汉字的编码取字元起始两笔的双笔组合码,因此,记忆量小,规律性和直观性强,能够按笔划顺序正确书写汉字的人都能使用无需专门的培训。
文档编号G06F3/023GK1049920SQ89106628
公开日1991年3月13日 申请日期1989年9月2日 优先权日1989年9月2日
发明者马庆勇 申请人:马庆勇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1