一种适用于汉语字词典编排的输入法编码的制作方法

文档序号:6330439阅读:829来源:国知局
专利名称:一种适用于汉语字词典编排的输入法编码的制作方法
技术领域
本发明涉及一种汉语字词典的编排技术及对应的电子输入査询技术。
技术背景现有的汉语字词典是按组成汉字的偏旁部首的笔画和汉语拼音为索引,以汉语拼音进行 排序编排的方式,使用很不方便,且不便使用电子编排。发明内容为克服目前汉语字词典编排的缺点,本发明提供一种适用于汉语字词典编排的输入法编 码,它不仅可作汉字电子输入和査询,还适于汉语印刷字词典编排,使印刷和电子编排得到 统一,以适应汉语字词典电子化的发展。本发明主要采取了以下技术措施l.首先将常用的偏旁部首和在汉字中做组成成份的成字给予代码。组成汉字的部旁(组成汉字的偏旁部首和单字的统称,下同)代码为汉语拼音字母,将 汉语拼音的字母和键盘上的英文字母相对应,另将上面两点未省略的ll和键盘上的V相对应。部旁取码规则如下① 部旁为常用字,就以它们拼音的首字母作其代码;② 取用的一部分偏旁部首为非常用字,分别用它们的名字关键字拼音的第一字母作代码;③ 为使取码在26个字母上分布较均匀减少重码,另将部分部旁作特殊安排^矛乡卑4米门爽月"按其拼音(或关键字拼音)的第一韵母为代码; 凡拼音为"yi"的常用成字,其代码定为 凡拼音为"yu"的常用成字,其代码为"V"; "一"只按笔画取码"H",不取"Y";内部无笔画的口代码为否则为"w",意围字框。它们不再拆开。④汉字拆分取部旁踬序从前到后,按最大部旁拆分,按各自的第一笔画的标准书写顺 序排先后,两部旁相重的部分不重复取码,不拆开交叉、不断开笔画取部旁。按以上所述,取用的部分非常用成字部旁及在上述规则外特殊安排的成字部旁与对应的 代码如下 A卄^ B 、/广 C豸D ^疋已U"、、w犬 E PI5考门
卜,夷四丰g处耒廿^击两^勺 h卓产幺I *纟米、(拼音是yi的所有成字) J 4韦酉太L K U、 3l丄艮,曰丼",古 m皿n升隹 0#p多匚共 q多生R >f s亇 T门厶u 、?V兴、月、(拼音是yu的所有成字) w夂夂口 X十w、"y iz豕iL谅说明豕--一在古代是猪的意思,故代码为z ,隹-一-难字身n ,匚一-匹字匡p , ra------罚字头f ,酉——酒字身j , *——亮字头l ,勺——勾字匡g ,夷——奉字头F ,厶——台字头T ,幺------幻字旁H ,丰——福字旁F ,豸------豺字旁C , w-------兰字头l , ^-----党字头d ,这些都是容易记忆的,不须死记硬背。2.编码规则对于不是由两部分构成的汉字如一体字和杂合字,则取字第一、第二、最末、倒数第二 笔画码。对于上下、左右、内外结构的汉字,汉字由ab两部分组成,含汉字的起笔画的部分为a, a、 b两部分各取两码,若a、 b为常用成字或取用的非成字部旁,则取码顯序分别为-a代码——a内第一部旁码-a韵母码——a最前笔画码,取够两码止b代码-----b内第一部旁码——b韵母码——b最末笔画码,取够两码止即先取a、 b每部分的代码,若部旁内还有一部旁,则再取其内的第一个部旁代码,若
无则取其部旁的第一韵母码,若A、 B是纯部首或变形字如"〗则不能取其韵母码 而分别取A、 B部分的首末笔画码。若A、 B不是常用成字或取用的部旁,则取码顺序为A (B)内含A (B)第一笔画的最前的部旁码------没有则取第一笔画码------下面的第一个部旁码-------无部旁则取最末笔画码。即分别取A、 B包含的第一个部旁码,没有取第一笔画码,再分别取其下面的第一个部旁 码,没有则取各部分的末笔画码。A部分取的码为字的前两码,B取的码为字的后两码,两部分码合在一起即为汉字的编 码,可在书纸印刷的字词典和电子字词典上作编排和査询用,也可作汉字的电子输入编码, 在电脑和便携工具上使用,在输入字词后打一个规定的键如"'",则可显示出对应的字词含 义和用法。词的编码四字及以上词分别取第一、二、三、末字的第一码;三字词分别取第一、二、 三字的第一码和第三字的第三码;二字词取码以次为第一字的第一、三码和第二字的第一、三码。
具体实施方式
凡字作部首末笔画变形的不作成字用,编码时不取韵母码,如"辛王土币厂手心八匕鱼 水"等的变形字,含这样的部旁的字有"改班搿掰瓣辨厂看反板版"等。有些字的部旁是常用单字的变形,如"告--—牛)善(鸛-一-羊)要(W-—-西)" 等,也当作部旁用但只取声母不能取韵母。有的部旁是常用成字且为多音字,在此取用一种发音可连打四下对应的字母键査看,如 "长"打"CCCC"和"ZZZZ"査看。常用的多音字在词中的代码和词中的发音相对应。如 "长、重、大"等。有一部分单字为不很常用的字,如戋倏邑婪肴罔舀禿寇巢盍匡癸亟敛犹曼要彦咨阑弘, 作部旁时是否作了常用字对待即是否给予了代码,在电子字词典中可连打四下对应的代码或 打"/"査看。
权利要求
1.一种适用于汉语字词典编排的输入法编码,它将组成汉字的部旁(本发明采用的汉字偏旁部首和单字的统称,它们给予了代码)代码为汉语拼音字母,将汉语拼音的字母和键盘上的英文字母相对应,另将上面两点未省略的ü和键盘上的V相对应。其特征为部旁为常用字,就以它们拼音的首字母作其代码;取用的一部分偏旁部首为非常用字,则分别用它们的名字关键字拼音的第一字母作代码;为使取码在26个字母上分布较均匀减少重码,另将部分部旁作特殊安排“艹氵冫扌纟衤彳米门月”按其拼音(或关键字拼音)的第一韵母为代码;凡拼音为“yi”的常用成字,其代码定为“i”;凡拼音为“yu”的常用成字,其代码为“v”;“一”只按笔画取码“H”,不取“Y”;内部无笔画的口代码为“K”,否则为“W”,意围字框。它们不再拆开。汉字拆分取部旁顺序从前到后,按最大部旁拆分,按各自的第一笔画的标准书写顺序排先后,两部旁相重的部分不重复取码,不拆开交叉笔画取部旁。“按以上所述,取用的部分非常用成字部旁及特殊成字部旁与对应的代码如下A艹B丷疒CD疋巳刂灬癶弋E卩阝彳门F罒礻G耒廿冖缶冎宀勹H虍幺I衤纟米、(拼音是yi的所有成字)J丬钅酉廴K凵、L亠艮肀彐M皿N廾隹O扌P彡匚Q犭R亻S饣T冂厶U冫氵V、月、(拼音是yu的所有成字)W攵夂口X忄Y讠Z豕辶爫凡是常用成字作部首末笔画变形的仍给与原成字一样的代码,但不作成字用,编码时不取韵母码。有些单字的部旁是常用单字的变形,如告()善()要(覀),也当作部旁用但只取声母不能取韵母。有的部旁是常用成字且为多音字,在此取用一种发音可连打四下字母键查看,如“长”打“cccc”和“zzzz”查询,常用的多音字在词中的代码和词中的发音相对应。如长、重、大等。有一部分单字为不很常用的字,如戋倏邑婪肴罔舀秃寇巢盍匡癸亟敛犹曼婴彦咨阑弘,作部旁时是否作了常用字对待即是否给予了代码,在电子字词典中可连打四下对应的代码或“/”查看。
2.根据权利1所述的査字编码输入法,其编码规则为对于上下、左右、内外结构的汉字,汉字由AB两部分组成,含汉字起笔画的部分为A, A、 B两部分各取两码,(D若A、 B为部旁,则取码顺序分别为A代码——A内第一部旁码-A韵母码——A最前笔画码,取够两码止B代码------B内第一部旁码——B韵母码——B最末笔画码,取够两码止即先取每部分的代码,若部旁内还有一部旁,则再取A、 B内的第一个部旁代码,若无 则取A、 B部旁的第一韵母码,若A、 B是纯部首或变形字如"4 ijw",则不能取其韵母码, 分别取A、 B部分的首末笔画码。② 若A、 B不是部旁,则取码顚序为-A (B)内含A (B)第一笔画的最前的部旁码-------设有则取第一笔画码-------下面的第一个部旁码-------否则则取最末笔画码。即分别取A、 B包含第一笔画的虽前部旁码,没有取第一笔画码,再分别取下面的第一个 部旁码,没有则取各部分的末笔画码。③ A部分取的码为字的前两码,B取的码为字的后两码,两部分码合在一起即为汉字的 査询和输入编码。 对于不是由两部分组成的杂合字和一体字,则取字第一、第二、最末、倒数第二笔画码。 构词码编码规则为二字词第一字的第一码+第一字的第三码+第二字的第一码+第二字的第三码 三字词第一字的第一码+第二字的第一码+第三字的第一码+第三字的第三码 四字及以上词四个码分别是第一、二、三、末字的第一码。
全文摘要
一种适用于汉语字词典编排的输入法编码,本发明涉及一种汉语字词典的编排技术及对应的电子输入查询技术。它旨在提供一种汉语字词编排印刷版和电子版都适用的输入法编码。它将大部分字分为两部分,每部分给两个其拼音的代码,为26个键盘字母的两两组合,将两部分的组合矩阵编排即为汉语字词库编码表,分布较均匀重码很少。作为输入法它适于各类人群。
文档编号G06F3/023GK101149644SQ20061015294
公开日2008年3月26日 申请日期2006年9月21日 优先权日2006年9月21日
发明者齐树亮 申请人:齐树亮
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1