一种数据库的自动编码及键盘检索方法

文档序号:6414239阅读:594来源:国知局
专利名称:一种数据库的自动编码及键盘检索方法
技术领域
本发明涉及一种以汉字字串作检索入口的数据库自动编码及键盘检索方法。
计算机汉字编码方法已经很多,但是专门针对以检索资料为主的汉字编码方法却很少。目前,利用电子计算机等电子信息处理器检索以汉字字串作为检索入口的数据库资料时,一般需要输入该汉字字串作为检索索引。或者只能显示所储存的数据库资料,然后再人工选择所需的数据项。无论前者抑或后者都要操作者花费较大的精力,对不熟悉汉字输入方法的操作者而言,困难将会更大。上述缺陷使得以汉字字串作检索入口的数据库技术的应用受到了极大的限制。目前,手提电话、传呼机、电子记事簿、个人数字助理器、个人移动信息处理器等产品已经可以通过无线电或红外线与个人电脑进行资料传输,解决了这些小键盘产品的大量汉字资料输入的速度问题。而它们的主要作用——用户资料检索,因键盘太小只能停留在菜单浏览选择或直接输入资料序号的方法上,其缺点是菜单浏览选择检索方法速度太慢,而直接输入资料序号则要死记大量的与资料对座的序号,十分不方便。即使使用五笔画输入方法输入汉字来检索,因输入每个汉字的重码率太高,速度同样很慢。当前,随着信息电子技术的发展,个人电脑、手提电话、电子记事簿、传呼机等产品的应用已较为普及,而这些产品的键盘都不太大,并且是以检索资料为主,所以如何有效地扩展这些产品的功能,使其同时可以方便、快捷地检索储存于其中的汉字信息是提高汉字信息技术、增强产品市场竞争力的重要手段。
鉴于汉字信息处理技术应用在手提电话、传呼机、个人移动信息处理器、个人数字助理器、电子记事簿等小键盘产品上所遇到的问题,本人发明了一种数据库的自动编码及键盘检索方法。
本发明的目的在于给小键盘电子信息处理产品提供一种以汉字字串作检索入口的用户数据库自动编码及其方便、快捷的键盘检索方法。使人们在检索资料时只需直接输入经电子信息处理器自动编码的数据项资料的检索码。它与所采用的汉字输入方法无关。给可以通过无线电、红外线等方法输入汉字的传呼机、手提电话、个人移动信息处理器、电子记事簿,电话等产品提供一种键数少、键盘简单、易于操作,便于记忆,操作速度快捷的汉字数据库自动编码及其检索方法。避免了传呼机、手提电话、个人移动信息处理器等产品用输入汉字字串方法检索资料时因输入汉字而遇到的键数少而重码率高,重码率低则键数多而且使用复杂的矛盾。克服了上述产品中用数据项序号检索资料时,数据项序号与相应资料内容的对应关系难以记忆而用菜单浏览方法检索资料时检索速度太慢的缺点。
为达到上述目的,本发明的第一种技术方案是这样的以汉字字串作检索入口的用户数据库自动编码及键盘检索方法,其特征在于A.对汉字的笔画进行分类;B.将分类得到的汉字基本笔画定义在键盘相应的键位上;C.根据依A分类所得的汉字基本笔画及汉字的笔画书写顺序取出汉字特定序位上的笔画,该笔画即定义为该汉字的编码,该汉字编码、区位码和汉字储存在电子信息处理器的存贮器中;D.电子信息处理器根据C的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字的编码,并将所取得的汉字的编码组合形成相应数据项的检索码;E.检索时,根据B的汉字基本笔画在键盘键位上的定义从键盘输入需检索的数据项的依D所定义的检索码。
本发明的第二种技术方案是这样的以汉字字串作检索入口的用户数据库自动编码及键盘检索方法,其特征在于A.对汉字的笔画进行分类;B.将分类得到的汉字基本笔画定义在键盘相应的键位上;C.根据依A分类所得的汉字基本笔画及汉字的笔画书写顺序取出汉字特定序位上的笔画,该笔画即定义为该汉字的编码,该汉字编码隐藏在汉字输入码中,汉字输入码和汉字储存在电子信息处理器的存贮器中;D.电子信息处理器根据C的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字的编码,并将所取得的汉字的编码组合形成相应数据项的检索码;E.检索时,根据B的汉字基本笔画在键盘键位上的定义从键盘输入需检索的数据项的依D所定义的检索码。
按照上述技术方案,汉字笔画的分类基本是依据汉字的书写及认知习惯进行的。汉字基本笔画定义在键盘相应的键位上,该键位可以用相应汉字基本笔画进行标示,也可以和字、字母或其他符号进行标示。上述技术方案中所称的汉字特定序位上的笔画是指根据汉字的笔画书写顺序确定出的该汉字的第1笔(首笔)、第2笔、……第n笔或者该汉字的末笔。对一个具体的技术方案而言,所称汉字特定序位上的笔画究竟某个汉字的第几笔是确定的,当然同一产品中也可以设置多个具体技术方案并存,由用户根据需要选择所需的方案,如一个方案取首笔,另一个方案取首尾笔或者首笔和末笔等。该笔画或与汉字基本笔画建立对应关系的其他符号系列中对应于该笔画的符号均可以定义为相应汉字的编码。需要用到的汉字及其编码和区位码预先储存于有关的电子信息处理器中。如果采用五笔划输入法输入汉字字串,则汉字编码可以隐藏在该汉字的输入码中,即电子信息处理器自动从该汉字的输入码中取出特定序位上的笔画码作为其编码,如取出某汉字五笔划输入码的头两码作为该汉字的编码。取出的汉字字串中汉字的编码组合形成相应数据项的检索码,以及根据键盘输入的检索码完成检索功能由软件来实现。由于本发明技术方案设计精巧且对硬件设备要求不高,因而可以应用本发明的电子器具绝非现有的数种。
本发明汉字笔画的基本分类可有以下几种1.汉字的基本笔画可分为“横”,“竖”,“撇”,“捺”;分别用以下符号表示“一”,“丨”,“丿”,“”;其中“点”归在“捺”内,所有“折”笔根据其第一折弯的前段或最后一折弯的后段分别归入“一”,“丨”,“丿”,“”。
2.汉字的基本笔画可分为“横”,“竖”,“撇”,“点”,“捺”;分别用以下符号表示,“一”,“丨”,“丿”,“丶”,“”,所有“折”笔根据其第一折弯的前段或最后一折弯的后段分别归入“一”,“丨”,“丿”,“丶”,“”。
3.汉字的基本笔画分为“横”,“竖”,“撇”,“点”,“折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“乙”;“捺”归在“点”内。
4.汉字的基本笔画分为“横”,“竖”,“撇”,“点”,“捺”,“折”;分别用以下符号表示,“一”,“丨”,“丿”,“丶”,“”,“乙”。
5.汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“顺折”,“反折”;分别用以下符号表示“一”,“丨”,“丿”,“”,“”,“”;其中“点”归在“捺”内,收笔时折向为顺时针方向的为“顺折”,反之为“反折”。
6.汉字的基本笔画分为“横”,“竖”,“撇”,“点”,“捺”,“顺折”,“反折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“”,“”;其中收笔时折向为顺时针方向的为“顺折”,反之为“反折”。
7.汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“单折”,“多折”;分别用以下符号表示“一”,“丨”,“丿”,“”,“”,“乙”;其中“点”归在“捺”内,“单折”为只有一个弯的折笔,“多折”为具有二个或二个以上转弯的折笔。
8.汉字的基本笔画分为“横”;“竖”,“撇”,“点”,“捺”,“单折”,“多折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“”,“乙”;其中“单折”为只有一个转弯的折笔,“多折”为具有二个或二个以上转弯的折笔。
以上分类方法使用起来各有优缺点,但是可以肯定将“点”和“捺”分开的分类方法不是本发明的优先方案,原因在于汉字中“点”和“捺”有时很难区分。
本发明汉字基本笔画在键盘键位上的分布不受本发明技术方案的限制,完全可以根据具体硬件的特点进行定义,也就是说汉字基本笔画在键盘键位上的定义分布是可以变化的。
以下是其中两种键盘定义方案1.汉字的每个基本笔画用单个按键定义。
2.汉字的每个基本笔画用二键次或二键次以上的按键组排列结合笔画的形态来定义。以下是其中的一些实例(1)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”;分别用以下符号表示“-”“丨”“丿”“”;“折”笔根据其第一个折弯的前段分别归入“横”,“竖”,“撇”,“捺”各笔中;键盘上同一行中不同的两个按键各输入一次定义为“横”的模拟键组,同一列中不同的两个键各输入一次定义为“竖”的模拟键组,不同行不同列其连线方向自上而下向左边的两个键各输入一次定义为“撇”的模拟键组,不同行不同列其连线方向自上而下指向右边的两个按键各输入一次定义为“捺”的模拟键组。
(2)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”;分别分别用以下符号表示“-”“丨”“丿”“”;“折”笔根据其最后一个折弯的后段分别归入“横”,“竖”,“撇”,“捺”各笔中;键盘上同一行中不同的两个按键各输入一次定义为“横”的模拟键组,同一列中不同的两个键各输入一次定义为“竖”的模拟键组,不同行不同列其连线方向自上而下向左边的两个键各输入一次定义为“撇”的模拟键组,不同行不同列其连线方向自上而下指向右边的两个按键各输入一次定义为“捺”的模拟键组。
(3)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“点”分别用以下的符号表示“-”,“丨”,“丿”,“”,,“丶”;“折”笔根据其第一个折弯的前段分别归入“横”,“竖”,“撇”“捺”,“点”中;键盘上同一行中不同的两个键各输入一次定义为“横”的模拟键组,同一列中不同的两个键各一次定义为“横”的模拟键组,不在同一行也不在同一列其连线方向自上而下指向左边的两个键各输入一次定义为“撇”的模拟键组,不在同一行也不在同一列其连线方向自上而下指向右边的两个键各输入一次定义为“捺”的模拟键组,任一按键连续输入两次定义为“点”的模拟键盘组。
(4)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“点”分别用以下的符号表示“-”,“丨”,“丿”,“”,,“丶”;“折”笔根据其最后一个折弯的后段分别归入“横”,“竖”,“撇”“捺”,“点”中;键盘上同一行中不同的两个键各输入一次定义为“横”的模拟键组,同一列中不同的两个键各一次定义为“横”的模拟键组,不在同行也不在同一列其连线方向自上而下指向左边的两个键各输入一次定义为“撇”的模拟键组,不在同一行也不在同一列其连线方向自上而下指向右边的两个键各输入一次定义为“捺”的模拟键组,任一按键连续输入两次定义为“点”的模拟键盘组。
(5)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“折”分别用以下的符号表示“-”,“丨”,“丿”,“”,“”;“点”归在捺内;用键盘中位于“口”形四个角上的键(1)、键(2)、键(3)、键(4)(图4)来定义各笔画的模拟键组;键(1)和键(2)各输入次组成“横”的模拟键组,键(2)和键(4)各输入一次来组成“竖”的模拟键组,键(2)和键(3)各输入一次组成“撇”的模拟键组,由键(1)和键(4)或由键(1)、键(3)和键(4)各输入一次组成“捺”的模拟键组,由键(1)连续输入两次组成“折“的模拟键组;(6)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“点”,“折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“丶”,“”;用键盘中位于“十”形四端的键(5)、键(6)、键(7)、键(8)(图5)来定义各笔画的模拟键组;键(6)和键(8)各输入一次组成“横”的模拟键组,由键(5)和键(7)各输入一次组成“竖”的模拟键组,键(5)和键(6)各输入一次组成“撇”的模拟键组,由键(5)和键(8)各输入一次组成“捺”的模拟键组,键(5)连续输入二次组成“点”的模拟键组,键(6)、键(8)和键(7)各输入一次组成“折”的模拟键组。
(7)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“顺折”“反折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“”,“”;“顺折”为第一个折向或最后一个折向为顺时针方向的折笔,反之为“反折”;“点”归在“捺”内;用键盘中位于“口”形四个角上的键(1)、键(2)、键(3)、键(4)(图4)来定义各笔画的模拟键组;键(1)和键(2)各输入一次组成“横”的模拟键组,键(2)和键(4)各输入一次组成“竖”的模拟键组,键(2)和键(3)各输入一次组成“撇”的模拟键组,键(1)和键(4)各输入一次组成“捺”的模拟键组,键(1)、键(2)和键(4)各一次组成“顺折”的模拟键组,键(1)、键(3)和键(4)各输入一次组成“反折”的模拟键组。
(8)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“顺折”“反折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“”,“”;“顺折”为第一个折向的折笔,反之为“反折”;“点”归在“捺”内;用键盘中位于“十”形四端的键(5)、键(6)、键(7)、键(8)(图5)来定义各笔画的模拟键组;键(6)和键(8)各输入一次组成“横”的模拟键组,由键(5)和键(7)各输入一次组成“竖”的模拟键组,由键(5)和键(6)各输入一次组成“撇”的模拟键组,由键(5)和键(8)各输入一次组成“捺”的模拟键组,由键(5)、键(8)和键(7)各输入一次组成“顺折”的模拟键组,由键(5)、键(6)和键(7)各输入一次组成“反折”的模拟键组;(9)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“顺折”“反折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“”,“”;“顺折”为最后一个折向为顺时针方向的折笔,反之为“反折”;“点”归在“捺”内;用键盘中位于“十”形四端的键(5),键(6)、键(7)、键(8)(图5)来定义各笔画的模拟键组;键(6)和键(8)各输入一次组成“横”的模拟键组,由键(5)和键(7)各输入一次组成“竖”的模拟键组,由键(5)和键(6)各输入一次组成“撇”的模拟键组,由键(5)和键(8)各输入一次组成“捺”的模拟键组,由键(5)、键(8)和键(7)各输入一次组成“顺折”的模拟键组,由键(5)、键(6)和键(7)各输入一次组成“反折”的模拟键组;(10)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“点”,“顺折”,“反折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“丶”,“”,“”;“顺折”为折笔的第一个折弯是顺时针方向的折笔,反之为“反折”;用键盘中位于“口”形四个角上的键(1)、键(2)、键(3)、键(4)(图4)来定义各笔画的模拟键组,键(1)和键(2)各输入一次组成“横”的模拟键组,键(2)和键(4)各输入一次组成“竖”的模拟键组,键(2)和键(3)各输入一次组成“撇”的模拟键组,键(1)和键(4)各输入一次组成“捺”的模拟键组,键(1)连续输入两次组成“点”的模拟键组,键(1)、键(2)和键(4)各输入一次组成“顺折”的模拟键组,键(1)、键(3)和键(4)各输入次组成“反折”的模拟键组。
(11)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“点”,“顺折”,“反折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“丶”,“”,“”;“顺折”为折笔的最后一个折弯是顺时针方向的折笔,反之为“反折”;用键盘中位于“口”形四个角上的键(1)、键(2)、键(3)、键(4)(图4)来定义各笔画的模拟键组,键(1)和键(2)各输入一次组成“横”的模拟键组,键(2)和键(4)各输入一次组成“竖”的模拟键组,键(2)和键(3)各输入一次组成“撇”的模拟键组,键(1)和键(4)各输入一次组成“捺”的模拟键组,键(1)连续输入两次组成“点”的模拟键组,键(1)、键(2)和键(4)各输入一次组成“顺折”的模拟键组,键(1)、键(3)和键(4)各输入次组成“反折”的模拟键组。
(12)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“点”,“顺折”“反折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“丶”“”,“”;“顺折”为折笔的第一个折弯或最后一个折弯是顺时针方向的折笔,反之为“反折”;用键盘中位于“十”形四端的键(5)、键(6)、键(7)和键(8)(图5)来定义各笔画的模拟键组,键(6)和键(8)各输入一次组成“横”的模拟键组,键(5)和键(7)各输入一次组成“竖”的模拟键组,键(5)和键(6)各输入一次组成“撇”的模拟键组,键(5)和键(8)各输入一次组成“捺”的模拟键组,键(5)连续输入两次组成“点”的模拟键组;键(5)、键(8)和键(7)各输入一次组成“顺折”的模拟键组,键(5)、键(6)和键(7)各输入一次组成“反折”的模拟键组;(13)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“单折”,“多折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“”,“乙”;其中“点”归入“捺”内;只有一个折弯的折笔为“单折”,二个或二个以上折弯的折笔为“多折”;用键盘中位于“口”形四个角上的键(1)、键(2)、键(3)、键(4)(图4)来定义各笔画的模拟键组,键(1)和键(2)各输入一次组成“横”的模拟键组,键(2)和键(4)各输入一次组成“竖”的模拟键组,由键(2)和键(3)各输入一次组成“撇”的模拟键组,键(1)和键(4)各输入一次组成“捺”的模拟键组,键(1)、键(2)和键(4)各输入一次组成“单折”的模拟键组,键(1)和键(2),键(4)和键(3)各输入一次组成“多折”的模拟键组。
(14)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“单折”,“多折”;分别用以下的符号表示“-”,“丨”,“丿”,“”,“”,“乙”;其中“点”归入“捺”内;只有一个折弯的折笔为“单折”,二个或二个以上折弯的折笔为“多折”;用键盘中位于“口”形四个角上的键(1)、键(2)、键(3)、键(4)(图4)来定义各笔画的模拟键组,键(1)和键(2)各输入一次组成“横”的模拟键组,键(2)和键(4)各输入一次组成“竖”的模拟键组,键(2)和键(3)各输入一次组成“撇”的模拟键组,键(1)和键(4)各输入一次组成“捺”的模拟键组,键(1)、键(2)和键(4)各输入一次组成“单折”的模拟键组,键(1)和键(2),键(4)和键(3)各输入一次组成“多折”的模拟键组。
(15)汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“单折”,“多折”;分别用以下的符号表示“-,“丨”,“丿”,“”,“”,“乙”;其中“点”归入“捺”内;只有一个折弯的折笔为“单折”,二个或二个以上折弯的折笔为“多折”;用键盘中位于“十”形四端上的键(5)、键(6)、键(7)、键(8)(图5)来定义各笔画的模拟键组,键(6)和键(8)各输入一次组成“横”的模拟键组,键(5)和键(7)各输入一次组成“竖”的模拟键组,键(5)和键(6)各输入一次组成“撇”的模拟键组,键(5)和键(8)各输入一次组成“捺”的模拟键组,键(5)、键(6)和键(7)各输入一次组成“单折”的模拟键组,键(5)、键(6)、键(7)和键(8)各输入一次组成“多折”的模拟键组。
对汉字进行编码时,最好根据以下三种方案来先取某汉字的笔画作为其编码1.对汉字进行编码时同时取出汉字的首笔笔画和末笔笔画,首笔笔画在前,末笔笔画在后,两者组合在一起定义为该汉字的编码,对只有一个笔画的汉字可以只取该笔画或取两次该笔画作为汉字的编码。
2.对汉字进行编码时只取出汉字的首笔笔画,首笔笔画即定义为该汉字的编码,只有一个笔画的汉字只取该笔画作为汉字的编码。
3.对汉字进行编码时只取出汉字的末笔笔画,末笔笔画即定义为该汉字的编码,只有一个笔画的汉字只取该笔画作为汉字的编码。
4.对汉字进行编码时同时取出汉字的首笔笔画和第二笔笔画,首笔笔画在前,第二笔笔画在后,两者结合在一起定义为该汉字的编码,对只有一个笔画的汉字可以只取该笔画或取两次该笔画作为汉字的编码。
另外,根据作为数据库检索入口的汉字字串来确定相应数据项的检索码也有多种方案,但大多是由于选取汉字字串的不同数目的汉字而产生的。以下四种方案是最可行的1.电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的每个汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
2.电子信息处理器也可以取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的首位汉字和末位汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
3.电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的前两个汉字的编码,对只有一个汉字的字串只取一个汉字编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
4.电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的前三个汉字的编码,对只有一或两个汉字字串的,取全部汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
虽然本发明检索时的重码率很低,但少量重码现象仍不可避免,此类问题可由软件来解决,例如显示出重码的数据项,或进行提示,然后由操作者进行选择。也可以在资料输入过程中边输入边判别重码。发现重码时提示用户,由用户修改新输入的字串,如已存入实施例2中以“陈大明”为字串的数据资料,再要输入以“陈大明”为字串的资料时,机器提示为重码。用户可改为“陈大明二”的字串输入,以便区别。
本发明中考虑到由于手提电话、传呼机、个人移动信息处理器等产品的汉字字库不可能将全部汉字都收藏,所以对字库中找不到的汉字,取本发明所述的编码表示该汉字,也就是说上述两方案中之A所述的汉字包括“一”,“丨”,“丿”,“丶”,“”,“”,“”,“乙”。
本发明对夹杂在汉字字串中的英文字母等字符可以作无字符处理,也可以用单个按键集中只用一个编码处理,也可以将这些字符分类后用若干特定编码定义,还可以对字符的笔画分类,取其与汉字一致的编码规则。
本发明的编码检索方法,不受汉字偏旁部首的限制,与汉语拼音无关,无需拆字,只需记忆汉字的几个基本笔画并能正确掌握汉字的书写笔画顺序即可随意操作。因而,本发明具有直观、便捷,记忆量小等优点。
下面结合实施例对本发明作进步说明。
以下实施例中汉字基本笔画分为“横”,“竖”,“撇”,“点”,“折”,即“一”,“丨”,“丿”,“丶”,“乙”;汉字的编码采用同时取该字的首笔画和末笔画的方法;汉字字串相应数据项的检索码取该字串所有汉字的编码组成。当然,选择的方案还有很多,但各种方案都是类似的,本领域普遍技术人员在本说明书中的基础上完全可以实施。故本说明书不再赘述。
实施例1汉字字串“汽车”中,“汽”的编码是“丶乙”,“车”的编码是“一丨”,字串“汽车”作为数据库检索入口时,相应数据项的检索码就是“丶乙一丨”。检索时,只需从键盘输入检索码“丶乙一丨”,即可检索到以汉字字串“汽车”作检索入口的数据项资料。
实施例2汉字字串“陈大明”中,“陈”的编码是“乙丶”,“大”的编码是“一丶”,“明”的编码是“丨一”,则字串“陈大明”作数据库检索入口时,相应数据项的检索码就是“乙丶一丶丨一”。检索时,只需从键盘输入检索码“乙丶一丶丨一”,即检索到以字串“陈大明”作检索入口的数据项资料。
实施例3汉字字串“欧阳天志”中,“欧”的编码是“一丶”,“阳”的编码是“乙一”,“天”的编码是“一丶”,“志”的编码是“一丶”,则字串“欧阳天志”作数据库检索入口时,相应数据项的检索码就是“一丶乙一一丶一丶”。检索时,只需从键盘输入检索码“一丶乙一一丶一、”,即可检索到字串“欧阳天志”作检索入口的数据项资料。
实施例4汉字字串“广东”中,“广”的编码是“丶丿”,“东”的编码是“一丶”,则字串“广东”作数据库检索入口时,相应数据项的检索码就是“丶丿一丶”。检索时,只需从键盘输入检索码“丶丿一丶”,即检索到以字串“广东”作检索入口的数据项资料。
实施例5本实施例以中国共产党第十四届中央委员会189名中央委员名单为例说明本发明检索方法检索码的重码情况。以下是中国共产党第十四届中央委员会中央委员名单丁文昌、丁关根、丁衡高、于永波(满族)、王克、王涛、王海、王群、王汉斌、王成斌、王兆国、王茂林、王忠禹、王维澄、王朝文(苗族)、王森浩、王瑞林、毛致用、乌力吉(蒙古族)、尹克升、邓鸿勋、艾知生、卢荣景、叶连松、叶选平、田纪云、田曾佩、史玉孝、白立忱(回族)、白清才、司马义·艾买提(维吾尔族)、成克杰(壮族)、吕枫、吕培俭、朱训、朱光亚、朱森林、朱敦法、朱(钅容)基、乔石、伍绍祖、任建新、华国锋、全树仁、多吉才让(藏族)、刘中一、刘正威、刘仲藜、刘华清、刘安元、刘纪原、刘忠德、刘剑锋、刘精松、齐怀远、关广富(满族)、江泽民、阮崇武、孙维本、李景、李鹏、李九龙、李长春、李文卿、李来柱、李岚清、李伯勇、李希林、李际均、李其炎、李泽民、李贵鲜、李铁映、李瑞环、李德珠(朝鲜族)、杨正午(士家族)、杨白冰、杨国梁、杨德中、吴仪(女)、吴文英(女)、吴邦国、吴官正、何光远、何竹康、何椿萍、佟宝存、谷善庆、邹家华、汪寥(左钅谬右)(女)、沈达人、宋健、宋汉良、宋克达、宋清渭、宋德福、迟浩田、张工、张震、张丁华、张万年、张立昌、张连忠、张勃兴、张思卿、张美元、张帼英(女)、张福森、陈玉英(女)、陈邦柱、陈光毅、陈希同、陈奎元、陈俊生、陈敏章、陈焕友、陈锦华、陈慕华(女)、邵华泽、邵奇惠、林丽韫(女)、固辉、罗干、和志强(纳酉族)、岳岐峰、周南、周文元、周玉书、周光召、周克玉、郑必坚、赵志浩、赵南起(朝鲜族)、赵富林、郝建秀(女)、胡平、胡启立、胡富国、胡锦涛、侯捷、侯宗宾、姜春云、袁伟民、热地(藏族)、贾庆林、贾志杰、贾春旺、顾秀莲(女)、顾金池、钱正英(女)、钱其琛、铁木尔·达瓦买提(维吾尔族)、倪志福、徐惠滋、高严、高天正、高德占、郭振乾、郭超人、陶驷驹、黄菊、黄璜、黄启(王加澡右)(女)、黄镇东、曹双明、曹(上艹下凡)生、戚元靖、崔乃夫、梁栋材、尉健行、彭(王加佩右)云(女)、葛洪升、蒋心雄、蒋民宽、蒋祝平、韩杼滨、程维高、傅全有、傅锡寿、鲁平、普朝柱、温家宝、谢非、谢世杰、雷鸣球、路甬祥、廖晖、谭绍文、魏金山以上中国共产党第十四届中央委员会189名中央委员经编码并统计,其重码情况如下其中属二重码的有12组(重码率为6%)(1)王涛和王海。
(2)王瑞林和李瑞环。
(3)和志强和周玉书。
(4)伍绍组和程维高。
(5)朱基和傅全有。
(6)朱敦法和侯宗宾。
(7)宋克达和谢世杰。
(8)张丁华和张万年。
(9)迟浩田和张立昌。
(10)王菊和王璜。
(11)李长春和李来柱。
(12)朱森林和钱其森。
其中属三重码的有1组(重码率为5‰)王茂林、王志武和王云云。
由本实施例可知,本发明检索方法重码率非赏低。
实施例6本实施例以1998.6.2《羊城晚报》第七版提供的深股市行情中股票名称(共381种股票)为例,其股票名称及重码情况如下深发展 深万科 深金田 深安达 世纪星源 深振业 深达声 深锦兴 深宝安 深华新 深物业 深南玻 深石化 深华源中浩 深康佳 深中华 深中冠 深深宝 深华发 深科技 深赤湾 深天地 深招港 深特力 小天鹅 通和东百 吉林化纤 南就中北 湖北宜化 东阿阿胶 徐工股分 富龙热力 华天酒店粤高速 张家界 丹东化纤 鄂武商 琼能源 海虹 港澳实业琼珠江 峨眉 粤富华 玉民源 天歌集团 金路集团 辽物资丽珠集团 渝开发 渝钛白 陕解放 甬中元 苏三山 银河动力武凤凰 美菱电器 白云山 广州海市蜃楼 东方宾馆 宁天龙厦海发 粤美的 桂柳工 粤美雅 大冷股份 穗恒运 粤华电万家乐 没电力 猴王 闽闽东 津国商 云南白药 粤电力 黔中天 佛山照明 威达医械 中联建设 青海明胶 重庆川仪 广西虎威 燕化高新 西安旅游 民族集团 焦作万方 大东海 湖北金环 大连渤海 石油济柴 吉林化工 经星宣纸 牡石化 北京比特 岳阳恒立 吉林教东 长安汽车 如意集团 湖北中天倍特高新 攀钢析村 铜都铜业 长春兰宝 三木集团 合金股份民族化工 风华高科 茂化实华 中辽国际 株洲庆 九江化纤格力电器 泰达股分 九州股份 华光陶瓷 重庆东源 金海股份海洋集团 珠海中富 南华西 长春高新 广西康达 永安林业武汉塑料 经纬纺机 昆明五华 武汉石油 吉诺乐 天发股份石狮新发 重庆实业 南风化工 南方摩托 青岛东方、湘计算机 桂林集琦 锌业股份 拉萨啤酒 福建双菱 山西三维 新华制药 内江峨柴 中色建设 武汉中百 湖北车桥 本钢板材 西藏矿业 锦州石化 六渡桥 通化金马 漳泽电力 西飞国际 盛道包装 延边公路 中核苏阀 新兴铸管 三毛派神 内蒙兴发英达股份 石炼化 武汉中商 北新建材 五一方 合成制药 江西水泥 华神科技 西北化工 盐湖钾肥大 燃气股份 太原刚玉宝商集团 中国武夷 中水渔业 湘酒鬼 一汽轿车 四川湖山京西旅游 美亚股份 金狮股份 北海银河 去铝股份第一纺织 四川锦华 飞亚达 深能源 深益力 深深房 英达深宝恒 深桑达 新都酒店 深华宝 中科健 深惠中 深南电深大通 中集集团 深鸿基 深长城 深南光 深纺织 南油物业深中侨 康达尔 深万山 深天马 深圳方大 深国商 深赛格辽通化工 有色中金 农产品 深圳华强 中兴通讯 深圳西林长城电脑 赛格 中康 华侨城 盐田港 深圳机场 许继电气冀东水泥 重庆华亚 宜春工程 华意压缩 有色鑫光 石油大明胜利股份 河北华玉 华立高科 沈阳机床 凯地丝绸 北方五环宝石 汇通水利 青岛国货 合肥百货 皖能电力 豫白鸽 吉制药 吉轻工 闽福发 湘中意 湘火炬 江铃汽车 苏物贸 甘长风 沙隆达 鲁石化 黔凯涤 琼南洋 银广夏 辽房天 万向钱潮 昆百大 陕长岭 新宏信 陕国投 西安民生 渝三峡 琼海药 琼海德 泸州老窖 长钢 苏常柴 新大洲 琼金盘 粤宏远广东甘化 青百 北海新力 托普软件 蜀都 东北电 川长江光明家具 粤金曼 黔轮胎 古汉集团 重订中药 中福实业 成都华联 内蒙宏峰 西北轴承 古井贡 东北药 蓝星清洗 青岛双星 国际大厦 韶能股份 金马集团 铜城集团 大同水泥 银山东省化工 河南思达 山东海龙 襄阳轴承 大连友谊 山推股份 苏常远东 东方电子 天然碱 佛山兴华 锦州六陆 保定天鹅 涪陵建陶 宏业集团 宝丽华 襄岛实业 惠天热电 泰康股份 灯塔油漆 成都联益 咸阳偏转 沈阳化工 佳纸股份 兴澄股份 厦门信达 正虹饲料 招商股份 浙江震元 湖北双环 大冶特钢 唐钢股份 天兴仪表 龙发股份 金泰发展 中乐种业中兴商业 广西斯半 韶钢松山 吉林纸业 焦作碱业 山东电缆西安饮食 金果实业 天宇电气 华东电子 北京化二 燕京啤酒环保股份 四川美丰 福建三农 振华科技 罗牛山 烟台冰轮 陕西金叶 天山纺织 美利纸业 江淮动力 辽河油田 锦化氯碱岳阳兴长 超声电子 国投原宜 广东福地 赣南果业 天大天财西南化机 中信国安 承德露露 中国七砂 五粮液 茂化永业北商技术 扬子石化 安凯客车 新希望 云南铜业 山东巨力 中商股份 三环股份 海南高速 峨眉山 华联商城 河南豫能 鞍钢新轧 赣能股份 天骥基金 蓝天基金 君安受益 广发基金南方基金 广证基金 华信基金 富岛基金 广证受益 海南银通基金开元其中属二重码的有5组(重码率为1‰)(1)天发股份和龙发股份。
(2)鲁石化和牡石化。
(3)深南光和深南电。
(4)深中华和深中侨。
(5)大冷股份和泰康股份。
其中属三重码的有2组(重码率为0.5‰)(1)珠海中富、燕京啤洒和武汉中商。
(2)深锦兴、深华源和深华宝。
由本实施例可知,本发明检索方法重码率非赏低。


图1是汉字基本笔画定义在电话机、传真机键盘数字键上的示意图。
附图2是汉字基本笔画定义在电话机、传真机键盘专门笔画键上的示意图。
附图3是电话机、传真机键盘汉字基本笔画部分定义在数字键或功能键上,部分定义在专门的笔画键上的示意图。
附图4是汉字基本笔画根据其形态定义在键盘“口”形四个角上的键(1)、键(2)、键(3)、键(4)上的示意图。
附图5是汉字基本笔画根据其形态定义在键盘“十”形四端上的键(5)、键(6)、键(7)、键(8)的示意图。
权利要求
1.一种以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于A.对汉字的笔画进行分类;B.将分类得到的汉字基本笔画定义在键盘相应的键位上;C.根据依A分类所得的汉字基本笔画及汉字的笔画书写顺序取出汉字特定序位上的笔画,该笔画即定义为该汉字的编码,该汉字编码、内码和汉字储存在电子信息处理器的存贮器中;D.电子信息处理器根据C的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字的编码,并将所取得的汉字的编码组合形成相应数据项的检索码;E.检索时,根据B的汉字基本笔画在键盘键位上的定义从键盘输入需检索的数据项的依D所定义的检索码。
2.一种以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于A.对汉字的笔画进行分类;B.将分类得到的汉字基本笔画定义在键盘相应的键位上;C.根据依A分类所得的汉字基本笔画及汉字的笔画书写顺序取出汉字特定序位上的笔画,该笔画即定义为该汉字的编码,该汉字编码隐藏在汉字输入码中,汉字输入码和汉字储存在电子信息处理器的存贮器中;D.电子信息处理器根据C的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字的编码,并将所取得的汉字的编码组合形成相应数据项的检索码;E.检索时,根据B的汉字基本笔画在键盘键位上的定义从键盘输入需检索的数据项的依D所定义的检索码。
3.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“捺”;分别用以下符号表示“一”,“丨”,“丿”,“”;其中“点”归在“捺”内,所有“折”笔根据其第一折弯的前段分别归入“一”,“丨”,“丿”,“”。
4.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“点”,“捺”;分别用以下符号表示,“一”,“丨”,“丿”,“丶”,“”,所有“折”笔根据其第一折弯的前段分别归入“一”,“丨”,“丿”,“丶”,“”。
5.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“点”,“折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“乙”;“捺”归在“点”内。
6.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“点”,“捺”,“折”;分别用以下符号表示,“一”,“丨”,“丿”,“丶”,“”,“乙”。
7.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“捺”,“顺折”,“反折”;分别用以下符号表示“一”,“丨”,“丿”,“”,“”,“”;其中“点”归在“捺”内,收笔时折向为顺时针方向的为“顺折”,反之为“反折”。
8.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“点”,“捺”,“顺折”,“反折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“”,“”;其中收笔时折向为顺时针方向的为“顺折”,反之为“反折”。
9.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“捺”,“单折”,“多折”;分别用以下符号表示“一”,“丨”,“丿”,“”,“”,“乙”;其中“点”归在“捺”内,“单折”为只有一个弯的折笔,“多折”为具有二个或二个以上转弯的折笔。
10.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”,“点”,“捺”,“单折”,“多折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“”,“乙”;其中“单折”为只有一个转弯的折笔,“多折”为具有二个或二个以上转弯的折笔。
11.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于经分类所得的汉字的每个基本笔画用单个按键定义。
12.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于经分类所得的汉字的每个基本笔画用二键次或二键次以上的按键排列组结合笔画的形态来定义。
13.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对汉字进行编码时同时取出汉字的首笔笔画和末笔笔画,首笔笔画在前,末笔笔画在后,两者组合在一起定义为该汉字的编码。
14.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对汉字进行编码时只取出汉字的首笔笔画,首笔笔画即定义为该汉字的编码。
15.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对汉字进行编码时只取出汉字的末笔笔画,末笔笔画即定义为该汉字的编码。
16.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对汉字进行编码时同时取出汉字的首笔笔画和第二笔笔画,首笔笔画在前,第二笔笔画在后,两者结合在一起定义为该汉字的编码。
17.根据权利要求13所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对只有一个笔画的汉字只取该笔画作为汉字的编码。
18.根据权利要求13所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对只有一个笔画的汉字取两次该笔画作为汉字的编码。
19.根据权利要求16所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对只有一个笔画的汉字只取该笔画作为汉字的编码。
20.根据权利要求16所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对只有一个笔画的汉字取两次该笔画作为汉字的编码。
21.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的每个汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
22.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器也可以取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的首位汉字和末位汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
23.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的前两个汉字的编码,对只有一个汉字的字串只取一个汉字编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
24.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的前三个汉字的编码,对只有一或两个汉字字串的,取全部汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
25.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于所述汉字包括“一”,“丨”,“丿”,“丶”,“”,“”,“”,“乙”。
全文摘要
本发明涉及一种以汉字字串作检索入口的数据库自动编码及键盘检索方法。本发明检索方法只需从键盘输入电子信息处理器自动生成的检索码。本发明检索方法记忆量小、直观、便捷,检索速度快,重码率低。
文档编号G06F17/30GK1240967SQ9811327
公开日2000年1月12日 申请日期1998年7月3日 优先权日1998年7月3日
发明者麦广树 申请人:麦广树
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1