数码字典与数字键盘输入法的关联技术的制作方法

文档序号:6330727阅读:239来源:国知局
专利名称:数码字典与数字键盘输入法的关联技术的制作方法
技术领域
本发明属于字典和计算机汉字输入法二个技术领域,并就这二项技术进行关联。
本发明所称的《数码字典》是一种语文工具书,与《新华字典》等同类,并非是计算机字典、电子字典等软件字典。
本发明所称的“数字汉字键盘输入法”是指利用阿拉伯数字0~9为编码码元的汉字输入法,在这里特指“超级数字码”。“超级数字码”是一种简单易学、高效率、多功能、多用途的汉字输入法,是本人的另一发明创造,已经申请国家发明专利,申请号00101346.7。
数字编码、字典及其进行关联的现有技术据作者所知,数字编码与字典进行关联的技术目前属于空白。
数字编码是指用阿拉伯数字对汉字进行编码,是一种用途广泛的输入法,除了用于计算机作为键盘输入之外,数字输入法在其它嵌入式系统中也广泛应用。“超级数字码”就是其中的优秀代表。
字典,是一种重要的语文工具书,但长期以来普通字典的结构都没有发生什么变化,技术上没有创新,很不适应现代社会的高速度、高效率的生活节奏。
普通字典的三大缺点是1.检索速度慢。普通字典查字都要经过查《部首目录》、《检字表》、《正文》三个步骤,而且部首必须选准,否则用时更多,多音字的查找也很费工夫。
2.没有与计算机汉字输入关联。简单地说就是会查字典还不会输入汉字。
3.没有起到指导汉字书写规范的作用。
发明的目的创造一种全新的《数码字典》,使之具有易学好用、快速高效、具有指导汉字书写规范作用等优点,并且与“超级数字码”进行技术关联,使得会查字典的人不用再另学其它输入法就能输入汉字。
本发明具有的优点以及用《数码字典》查字的积极效果1.利用《数码字典》查字,速度比普通字典提高了三至四倍。
根据本人的实际测验,平均每查一个字,普通字典用时一分钟,《数码字典》用时16秒。
2.《数码字典》具有指导汉字书写规范的作用。
汉字的编码严格遵循了国家有关标准和规范,每一个汉字(指字头)都增加了笔画数和标准笔顺。
3.与“超级数字码”汉字输入法实行技术关联。
《数码字典》与“超级数字码”的关联,使得会查字典的人不用学习其它输入法就会输入汉字,相反,会用“超级数字码”的人也会用《数码字典》。
4.《数码字典》和“超级数字码”都具有简单易学的特点,任何会写汉字的人用十分钟左右的时间都可学会这二项关联的技术。
本发明的内容一、基本情况本发明利用阿拉伯数字0123456789作为码元,对汉字进行编码,然后根据数字排序对字典里的字头进行排列,即得出一种全新的具有数序结构的《数码字典》。
《数码字典》与“超级数字码”在下面各项技术内容上有关联(见关联表),本说明书只就这些内容进行陈述,有关“超级数字码”的其它技术内容,请参考国家知识产权局专利局00101346.7号发明专利申请文件。
表一、《数码字典》与“超级数字码”技术关联表
二、具体内容1.码元。
《数码字典》编码所用的码元是0123456789,与“超级数字码”所用的标准码元是相同的(“超级数字码”还有辅助码元,功能是用作超级功能设计),相同的码元是成功关联的基础。
2.码长。
二至四码的汉字,它们的码长是相同的,都是二至四码,一码、五码以上汉字,《数码字典》与“超级数字码”的许可码兼容。
3.笔画部件。
共有三种类型(1).五种笔画一、丨、丿、丶、乙。
(2).十个汉字数字一、二、三、四、五、六、七、八、九、十。
(3).五类二十六个部件a.口、言、讠。
b.土、水、氵、冫、石。
c.木、竹、艹。
d.日、月、王、火、金、钅、曰。
e.人、亻、彳、手、扌、心、忄、疒。这些笔画和部件《数码字典》和“超级数字码”完全相同。4.部件代码。两者完全相同0—十、口、言、讠1—一2—二、丨3—三、丿4—四、丶5—五、乙6—六、土、水、石、氵、冫7—七、木、竹、艹8—八、日、月、王、火、金、曰、钅9—九、人、手、心、疒、扌、忄、亻、彳表二汉字笔画、部件代码表
部件代码说明①12345是笔画代码,它们与《现代汉语通用字笔顺规范》定义的五个基本笔画的代码是一样的。其中 (提)归为一(横),代码为1;亅(竖左钩)归为丨(竖)代码为2;(捺)归为丶(点),代码为4;各种折笔笔画归为乙(折),代码为5。
②一、二、三、四、五、六、七、八、九、十为数字部件,这十个数字部件的代码对应于1234567890。
③“口”与“0”相似,言(讠)与“口”有联系,0作为它们的代码最合适。
注意“口”(外框)不作“口”,只能根据笔顺取码。
④土、水(氵、冫)、石都是地球上基本的物质,归类后用6作为它们的代码。
⑤木、竹、艹都是植物,归类后用7作为它们的代码。
⑥日(太阳)、月(月球)、王(海王星)、火(火星)、金(钅。金星)都是太阳系星球,自然归类在一起,曰与日相似,它们的代码都是与“日”字相似的8。
⑦人(亻彳)、手(扌)、心(忄)、疒都与“身体”有联想,它们的代码是9。
5.一般的取码规则。
两者完全相同。
一般的取码规则如下(1).严格遵循国家语委标准化工作委员会制订的汉字笔顺规范。
(2).所有的汉字(或其它构字部件)必须分解成代码表中的笔画、数字、部件(以下有时统称为“部件”)。
(3).分解时,在不违反其它规则的前提下,优先照顾最大的部件。
例如“灭”分解成一、火,而不是分解成一、丶、丿、人。
(4).分解的部件不允许交叉。
例如“中”不能分解成口、丨;“丸”不能分解成九、丶。
(5).分解的部件允许相连。
例如“白”分为丿、日;“干”分为一、十;“士”分为十、一。
(6).二条或三条长度基本一致的“一”集合在一起,笔顺又相连的,按“二”、“三”取码。
例如“非”分解成丨、三、丨、三;“且”分解成丨、乙、二、一。
(7).字形不能被分隔。“小”不能分解成丨、八,只能分解成丨、丿、丶。
(8).一些外观上与“水”相似的部件作为“水”字处理。
例如黎、泰、录等字的下部;函、丞、蒸等字的中部。
(9).一些外观上与“月”相似的部件作为“月”字处理。
例如有、育、肩等字的下部。
(10).“壬”分解为丿、十、一。“廷、挺、庭”等字的“壬”部按此分解。
(11).状、兆、脊等字的“冫”不作两点水处理,习、匀、弱等字的末部“冫”作两点水处理。
(12).“艹”有些扩展,只要是由一、丨、丨构成且不违反其它规则,均可看作“艹”。
例如“共”分解成艹、一、八;“其”分解成艹、二、一、八。
6.单字取码规则。
二至四码的字相同,一码字兼容,五码以上与许可码兼容。
(1).一码字《数码字典》汉字的编码就是本身的代码,“超级数字码”的一位编码是高频字(主要是为了提高效率),所以其一码字的编码是代码后面加“.”。
例如二《数码字典》编码2“超级数字码”编码2.
五 55.
日 88.
人 99.
(2).二至四码字两者编码相同,都是有多少码取多少码。
例如从《数码字典》编码99“超级数字码”编码99众 999 999工 121 121为 4354 4354(3).五码以上的汉字,《数码字典》取前二码和后二码,“超级数字码”的许可码是取前二码和后二码再加“..”(标准码增加取码,以减少重码率)。
例如左《数码字典》编码1321 “超级数字码”许可码1321..
前 43224322..
检 79317931..
部 41524152..
(4).繁体字、异体字与简体字的取码规则相同。
三、《数码字典》的使用方法《数码字典》的释义部分与市面上的普通字典基本一致,有关释义过程中一些特殊符号的意义和用法等也与普通字典基本相同,具体情况请参阅《数码字典》的《凡例》。
在这里主要说明《数码字典》的结构特点和使用步骤,并举例。
1.《数码字典》的结构。
分整体结构和局部结构。
本字典的整体结构与普通字典的整体结构具有本质区别一般字典都有《部首检字表》,正文部分则是按汉语拼音字母音序排列,而《数码字典》不再设立《部首检字表》,正文是按阿拉伯数字汉字编码数序排列,这种排列方式使得读者可以直接根据汉字的数字编码进行检索,所以本字典的正文部分不再编页码。另外,本字典的同形多音字集中在一起(普通字典则根据拼音分散排列)。
《数码字典》整体结构如下说明凡例编码规则部首与常用部件分解表新旧字形对照表繁简对照表正文(按汉字的编码排序)附录注①《说明》部分的内容是《数码字典》和“超级数字码”简介。
②《凡例》部分的内容是《数码字典》的使用事项,与一般字典类似。
③《编码规则》则是介绍《数码字典》的取码方法,该规则与“超级数字码”的取码规则兼容,即具有关联。
④《部首与常用部件分解表》主要介绍部首及常用部件的分解,该表对还没有掌握编码规则的新用户具有帮助。
⑤《新旧字形对照表》与普通字典相同。
⑥《繁简对照表》的作用是把繁体字、异体字转化为对应的简体字。
⑦《正文》部分是本字典的核心部分,与一般的字典相比,具有以下二大特点a.正文部分不编页码,查字完全依靠该字的数字编码。
b.同形多音字全部排在一起。
⑧《附录》部分目前收有《汉语拼音方案》与《我国少数民族简表》,可根据实际需要增加。
本字典的局部结构增加了以下二项内容a.大部分的字注有同音字。
b.释义后增加了该字的笔顺和笔画数。
《数码字典》的局部结构如下
大号字头和拼音字母、注音释义部分同音字笔画数和笔顺注①字头、拼音字母和注音、释义部分与普通字典大同小异。
②同音字有三种情况a.无〔〕号的属于同声同调。
b.有〔〕号的属于同声不同调。
c.有()号的属于复合读音。
③笔顺以国家语文文字工作委员会标准化工作委员会编《现代汉语通用字笔顺规范》为标准,标出的笔顺有三种情况a.标出全笔顺。
例“豕”的笔顺是一、丿、乙、丿、丿、丿、丶。
b.笔画+汉字。
例“千”的笔顺是丿、十。
c.汉字+汉字。
例“现”的笔顺是王、见。
详细情况请《数码字典》的《凡例》部分。
2.《数码字典》的使用步骤。
(1).根据编码规则给待查字编码。
本字典是依据汉字的数字编码直接进行检索的,所以正确确定所查汉字的编码是最关键、最重要的环节,它决定了查字的成功与否。对于已经熟悉取码规则的用户,这一步非常直观、简单,基本上一目了然,对于还没有熟悉取码规则的新用户,可通过《部首与常用部件分解表》逐步熟悉。
(2).依据汉字的编码在《正文》里进行检索。
只要编码正确,本字典就可以利用汉字的编码直接检索该字,所以了解《数码字典》排序规律是很有必要的。
《数码字典》的排序规律如下①汉字的编码按0~9的次序排序,以0为首的编码排先,以9为首的编码排后。
例0010、0910;123、24;3550、4586、50等等。
②码长相同时,按编码从小到大进行排序。
例01、06;123、124;2541、2543等等。
③码长不相同时,短码排先,长码排后。
例8、81;25、253;259、2590等等。
④编码相同时,按汉字的笔画数从少到多排序。
例编码为3514的汉字排序是蚀、独、触、鲺、螽、蟹。
3.繁体字、异体字的检索方法。
《数码字典》以简体字的编码直接进行检索,繁体字、异体字的检索分以下二种情况(1).兼作“字头”的繁体字、异体字的检索方法这种繁体字、异体字可作为简体字看待,检索方法与一般简体字的检索方法完全一致。
例如干湿的“干”字,其繁体字“乾”;借口的“借”字,其繁体字“藉”等等,这些字既是繁体字,又另作“字头”,可直接根据其编码检索。
(2).一般繁体字、异体字的检索方法普通的繁体字和异体字是不能直接进行检索的,只能通过《繁简转换表》将繁体字和异体字转换成对应的简体字,再根据该简体字的编码进行检索。
《繁简转换表》中的繁体字和异体字的排序是根据繁体字和异体字的编码进行排列的,其排列规律与《正文》中“字头”的排列规律相同。
繁体字、异体字的取码规则与简体字兼容,编码方法完全相同。
4.复音词的检索方法。
复音词的检索是以单字的检索为前提的,一般情况下查第一个字。
5.检索举例。
例1.—阊根据规则确定编码为4288。
根据字典的排序规律检索4288编码即可查到“阊”。
例2.—熏确定编码为3144。
检索3144编码即可查到“熏”。
从本例可看出,只要认出第一笔画“丿”(代码为3),第二笔画“一”(代码为1),以及最后二个笔画“丶、丶”(代码为4),中间部分根本上不用理睬。
例3.—鲺确定编码为3514。
检索3514编码。
根据“鲺”的笔画数为16画即可查到“鲺”。
例4.—铿锵确定“铿”的编码8246。
检索8246编码即可查到“铿”。
在“铿”的释义中即可查到“铿锵”一词。
实现本发明的最好方式。
本发明是一种工具书与计算机汉字输入法的关联技术,实现该技术的好办法是同时把《数码字典》与“超级数字码”推向普及。
目前,《数码字典》已经完稿,技术上可以出版供读者使用。“超级数字码”已经申请国家发明专利(已通过初审),该输入法软件可以在北京希望公司UCDOS5.0以上和Microsoft公司中文Windows3.X、Windows95/98等汉字系统上使用。
权利要求
本发明有以下二项
权利要求
1.《数码字典》与“超级数字码”关联技术的保护。本发明之所以具有大幅度地提高查字速度、编码与输入法兼容、具有指导汉字的书写规范等先进性,主要归功于《数码字典》与“超级数字码”在许多技术领域进行了关联,这些关联的项目以及技术特征如下(1).码元兼容。《数码字典》编码所用的码元是0123456789,与“超级数字码”所用的标准码元是相同的(“超级数字码”还有辅助码元,功能是用作超级功能设计),相同的码元是成功关联的基础。(2).码长兼容。二至四码的汉字,它们的码长是相同的,都是二至四码,一码以及五码以上的汉字,《数码字典》与“超级数字码”兼容。(3).笔画部件相同。共有三种类型①五种笔画一、丨、丿、丶、乙。②十个汉字数字一、二、三、四、五、六、七、八、九、十。③五类二十六个部件a.口、言、讠。b.土、水、氵、冫、石。c.木、竹、艹。d.日、月、王、火、金、钅、曰。e.人、亻、彳、手、扌、心、忄、疒。这些笔画和部件《数码字典》和“超级数字码”完全相同。(4).部件代码相同。《数码字典》与“超级数码码”完全相同汉字笔画、部件代码表
(5).一般的取码规则相同。一般的取码规则如下a.严格遵循国家语委标准化工作委员会制订的汉字笔顺规范。b.所有的汉字(或其它构字部件)必须分解成代码表中的笔画、数字、部件(以下有时统称为“部件”)。c.分解时,在不违反其它规则的前提下,优先照顾最大的部件。例如“灭”分解成一、火,而不是分解成一、丶、丿、人。d.分解的部件不允许交叉。例如“中”不能分解成口、丨;“丸”不能分解成九、丶。e.分解的部件允许相连。例如“白”分为丿、日;“干”分为一、十;“士”分为十、一。f.二条或三条长度基本一致的“一”集合在一起,笔顺又相连的,按“二、三”取码。例如“非”分解成丨、三、丨、三;“且”分解成丨、乙、二、一。g.字形不能被分隔。“小”不能分解成丨、八,只能分解成丨、丿、丶。h.一些外观上与“水”相似的部件作为“水”字处理。例如黎、泰、录等字的下部;函、丞、蒸等字的中部。i.一些外观上与“月”相似的部件作为“月”字处理。例如有、育、肩等字的下部。j.“壬”分解为丿、十、一。“廷、挺、庭”等字的“壬”部按此分解。k.状、兆、脊等字的“冫”不作两点水处理,习、匀、弱等字的末部“冫”作两点水处理。1.“艹”有些扩展,只要是由一丨丨构成且不违反其它规则,均可看作“艹”。例如“共”分解成艹、一、八;“其”分解成艹、二、一、八。(6).单字取码规则兼容。四码以下的字相同(指数字部分),五码以上与“超级数字码”兼容。a.一码字《数码字典》汉字的编码就是本身的代码,“超级数字码”的一位编码是高频字(主要是为了提高效率),所以其一码字的编码是代码后面加“.”。b.二至四码字两者编码相同,都是有多少码取多少码。c.五码以上的汉字,《数码字典》取前二码和后二码,与“超级数字码”的许可码兼容。d.繁体字、异体字与简体字的取码规则相同。这种二者技术上的关联,使《数码字典》与“超级数字码”的编码具有兼容性,这种规则上的兼容,使得读者只要会用《数码字典》查字(实际上会写字者只需要几分钟时间)就会在计算机上使用“超级数字码”输入汉字。请求保护的范围码元、码长、部件(包括笔画和数字)及部件代码、取码规则(包括一般规则和单字规则)的关联。
2.《数码字典》无页码技术的保护。《数码字典》除了与“超级数字码”进行技术关联以达到会用字典就会输入汉字的目的以外,还应用了无页码技术,该技术的主要特征是根据汉字的编码排序,依靠汉字的编码进行检索,查字与页码无关,这种技术的应用使得《数码字典》查字速度提高了三至四倍,也是《数码字典》与普通字典主要区别之一,要求进行技术保护。《数码字典》的排序规律如下(1).汉字的编码按0~9的次序排序,以0为首的编码排先,以9为首的编码排后。例0010、0910;123、24;3550、4586、50等等。(2).码长相同时,按编码从小到大进行排序。例01、06;123、124;2541、2543等等。(3).码长不相同时,短码排先,长码排后。例8、81;25、253;259、2590等等。(4).编码相同时,按汉字的笔画数从少到多排序。例编码为3514的汉字排序是蚀、独、触、鲺、螽、蟹。请求保护的范围正文部分的无页码设计。
全文摘要
本发明属字典(工具书)和汉字输入法领域。主要解决普通字典查字速度慢,无指导汉字书写规范作用,与输入法没有联系的问题。主要技术特征:1.《数码字典》用数字对字头编码,根据编码排序和检索(不用编页码),查字速度比普通字典提高三至四倍。2.技术上与“超级数字码”关联,读者短时间学会查字和汉字输入技术。3.增加汉字的书写笔顺。用途:供广大群众作语文工具书和学习汉字输入技术使用。
文档编号G06F3/023GK1308266SQ0013136
公开日2001年8月15日 申请日期2000年11月1日 优先权日2000年11月1日
发明者黎明 申请人:黎明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1