部件声母笔划识别汉字编码法及其键盘的制作方法

文档序号:6407960阅读:337来源:国知局
专利名称:部件声母笔划识别汉字编码法及其键盘的制作方法
一.本发明是一种汉字编码方法及其键盘。它利用汉字高频度部件容易拼读发音的特点,精心选取了121种共181个高频度、易拼读部件(字根),部件通过其常规读法之关键字与汉语拼音声母建立对应关系,汉语拼音声母又与英文字母建立对应关系,这样便在英文键盘上建立本编码法的汉字部件键盘。该键盘体现了汉字部件、部件拼音(主要是声母)、部件代码(键盘上的英文字母)三者之间全部的对应关系。部件以其汉语拼音的声母发音(英文键O,V上的部件除外)。声母与英文字母对应关系是声母ZH和Z、CH、SH分别对应英文A、I、U,拼音YU及YUE、SHUI分别对应英文V、O,其他声母与其同形的英文字母对应。
例如,’广’的常规读法为’广字旁儿’(GuangZiPangr),关键字为’广’,其拼音声母是’G’,部件’广’便定位在汉字部件键盘上的G(哥)键。按此法,80%的部件可在汉字部件键盘上定位,其他部件按笔划、笔划数、位置、易记等要素定位。部件及其代码详见说明书附图-部件声母笔划识别汉字编码法汉字部件键盘。
二.拆字取部件依照常规法则书写顺序、直观、能大不小,能离不连、能连不交。
三.编码公式与法则编码公式为汉字编码=部件代码+汉字首末笔划识别码+低频字重码处理码部件代码为必需项,其后二者为可选项,最长码为四码。
单字编码法则1.由四个或四个以上部件构成的字取其前三部件和末部件的代码
2.不足四部件的字取其部件代码,并加上汉字首末笔划识别码(简称识别码),识别码多达20个,按首笔划分5组。
(1)首笔划为横末笔划分别为横、竖、撇和捺(点)、折的汉字的识别码分别为G、F、D、S。
(2)首笔划为竖末笔划分别为横、竖、撇和捺(点)、折的汉字的识别码分别为H、J、K、L。
(3)首笔划为撇末笔划分别为横、竖、撇和捺(点)、折的汉字的识别码分别为T、R、E、W。
(4)首笔划为捺(点)末笔划分别为横、竖、撇和捺(点)、折的汉字的识别码分别为Y、U、I、O。
(5)首笔划为折末笔划分别为横、竖、撇和捺(点)、折的汉字的识别码分别为B、V、C、X。
在识别码中,末笔划为撇、捺、点者作为同一种笔划处理,本编码法通称它们为’斜’,折包括除竖钩外的勾类笔划。
例对-YC(部件代码)+C(识别码,首笔划为折,末笔划是点)讨-YC(部件代码)+I(识别码,首笔划为点,末笔划为点)3.对于汉字键盘上的成字。如’大’,’立’,先取该成字部件的代码,然后取其第一,二,末单笔划的代码,不足四码则取实际码长,例如D键上的’大’字的编码为DGTY,F键的’二’为FGG4.按照情况1.2.3.构成的汉字编码,如出现重码,高频字排先,如此时重码中含国标基本集的二级汉字,则这些二级字三码字加’Z’,四码字则改第四码为’Z’,以便减少重码。
5.简码(1)一级简码(一码)为A些 B的 C过 D大 E被 F把 G不 H和 I在 J几 K国 L了M同 N好 O没 Q比 R是 S能 T我 U着 V也 W这 X要 Y说(2)二级简码(二码)选取的基本原则一级汉字中的双部件字,在不加识别码的情况下,无重码者即为简码,有重码者选最高频度字为简码。
(3)三级简码(三码)选取的基本原则在不加识别码的情况下的一级三部件汉字与加识别码后的一级二部件汉字编码总和中,无重码者即为简码,有重码者选最高频度字为简。
5.2,5.3中的汉字频度依照《现代汉语频率词典》(北京语言学院语言教学研究所编._1996.06)四.词汇编码法则双字词汇,各取前两部件代码。例理论-WRYR三字词汇,前两字取首码。第三字取前两码,例计算机-YAMJ四字词汇,取四字首码。例市场经济-YTSO四字以上词汇,取前三字取首码,取最后一字首码。
例计算机应用-YAJV五.本汉字编码法的优点是易学好用、直观、输入效率高。
六.


名称部件声母笔划识别汉字编码法汉字部件键盘。
1.部件按5种情况排列在键盘上(1)按其习惯读法之关键字的汉字拼音声母与英文字母对应关系。例土-T,口-K,山-U(拼音声母SH)石(Shi)例外。
(2)接其汉字拼音与英文字母对应关系例如水(拼音Shui)-I 雨(拚音Yu)-V(3)按其属同一部首或形状类似排列例如犬和犭,己和巳(4)按笔划、笔划数、位置、易记等要素定位。
例如一二三四横的代码分别是G、F、D、S一折二折三折的代码都是V(5)按汉语’衣’与英文字母E发音相似排在E键上2.每个英文字母键上的部件的位置是固定的,分上、中、下排3.Z键为低频字重码处理码4.P键在汉字输入系统中用作替代任意部件,以实现模糊查找(前方一致或前后方一致中间任意)七.本汉字编码法机及其键盘容易应用于汉字输入系统,本发明者已利用关系型数据库管理系统Foxpro V2.5的开发工具实现了国标《信息交换用汉字编码字符集(基本集)》中的6763个汉字和6000常用词汇的编码、建库和汉字输入及编辑功能。
权利要求
1.部件声母笔划识别汉字编码法及其键盘,其特征是全部汉字由该编码法中固定在汉字部件键盘上的120种180个部件构成,汉字编码按照本编码法单字编码的五条法则由部件代码+汉字首末笔划识别码+低频字重码处理码生成,部件代码为必需项,识别码和低频字重码处理码项为可选项。词组编码遵照本编码法中词组编码法则。
2.按权利要求1所述的部件及其代码,其特征是140个部件通过其常规读法之关键字与汉语拼音声母建立对应关系,汉语拼音声母又与英文字母建立对应关系,最终建立部件与英文字母直接的对应关系(即代码关系),这里所指的140个部件包含相同部首和部件形状类似两种情况。
3.按权利要求1中所述的汉字编码生成,其特征是最长码为四码,四个或四个以上部件的字取其前三部件和末部件的代码。不足四部件的字取其部件代码,并加上汉字首末笔划识别码。
4.按权利要求1所述的汉字首末笔划识别码,其特征是首笔划分别为横、竖、撇和捺(点)、折,末笔划分别为横、竖、撇、捺(点)、折的五组识别码分别是(G F D S)、(H J K L)、(T R E W)、(Y U I O)、(B V C X)。
5.按权利要求1中所述的低频字重码处理码,其特征是部件代码+汉字首末笔划识别码出现重码时,对于重码中的国标基本集中的二级汉字,三码字加'Z',四码字则改第四码为'Z'。
全文摘要
部件声母笔划识别汉字编码法及键盘涉及中文信息处理。它利用汉字高频度部件容易拼读的特点,选取了120种共180个高频度易拼读部件,大部分部件通过其常规读法之关键字与汉语拼音声母、拼音声母与英文字母这两个对应关系,建立部件代码及部件键盘。汉字编码由部件代码+汉字首末笔划识别码+低频字重码处理码生成。部件代码为必需项,后二者为可选项,最长码为4码。该编码法具有易学好用、直观、重码少、输入效率高的特点。
文档编号G06F3/023GK1099494SQ94110908
公开日1995年3月1日 申请日期1994年4月1日 优先权日1994年4月1日
发明者唐晓卫 申请人:唐晓卫
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1