一种数据库的自动编码及键盘检索方法

文档序号:6414241阅读:214来源:国知局
专利名称:一种数据库的自动编码及键盘检索方法
技术领域
本发明涉及一种以汉字字串作检索入口的用户数据库自动编码及键盘检索方法。
计算机汉字编码方法已经很多,但是专门针对以检索资料为主的中文资料编码方法却很少。目前,利用电子计算机等电子信息处理器检索以汉字字串作为检索入口的数据库资料时,一般需要输入该汉字字串作为检索索引。或者只能显示所储存的数据库资料,然后再人工选择所需要的数据项。无论前者抑或后者都要操作者花费较大的精力,对不熟悉汉字输入方法的操作者而言,困难将会更大。上述缺陷使得以汉字字串作检索入品的数据库技术的应用受到了极大的限制。目前,手提电话、传呼机、电子记事簿、个人数字助理器、个人移动信息处理器等产品已经可以通过无线电或红外线与个人电脑进行资料传输,解决了这些小键盘产品的大量汉字资料输入的速度问题。而它们的主要作用——用户资料检索,因键盘太小只能停留在菜单浏览选择或直接输入资料序号的方法上,其缺点是菜单浏览选择检索方法速度太慢,而直接输入资料序号则要死记大量的与资料对座的序号,十分不方便。即使使用五笔画输入方法输入汉字来检索,因输入每个汉字的重码率太高,速度同样很慢。当前,随着信息电子技术的发展,手提电话、传呼机等产品的应用已较为普及,而这些产品的键盘都不太大,并且是以检索资料为主,所以如何有效地扩展这些产品的功能,比如增加中文电子电话簿功能,使其同时可以方便、快捷地检索储存于其中的汉字信息是提高汉字信息技术、增强产品市场竞争力的重要手段。
鉴于汉字信息处理技术应用在手提电话、传呼机等小键盘产品上所遇到的问题,本人发明了一种用户数据库的自动编码及键盘检索方法。
本发明的目的在于给小键盘电子信息处理产品提供一种以汉字字串作检索入口的用户数据库自动编码及其方便、快捷的键盘检索方法。使人们在检索资料时只需直接输入经电子信息处理器自动编码的数据资料的检索码。它与所采用的汉字输入方法无关。给可以通过无线电、红外线等方法输入汉字的传呼机、手提电话等产品提供一种键数少、键盘简单、易于操作,便于记忆,操作速度快捷的汉字用户数据库自动编码及其检索方法。避免了传呼机、手提电话等产品用输入汉字字串方法检索资料时因输入汉字而遇到的键数少而重码率高,重码率低则键数多而且使用复杂的矛盾。克服了上述产品中用数据项序号检索资料时,数据项序号与相应资料内容的对应关系难以记忆而用菜单浏览方法检索资料时检索速度太慢的缺点。
为达到上述目的,本发明的第一种技术方案是这样的以汉字字串作检索入口的用户数据库自动编码及键盘检索方法,其特征在于A对汉字的笔画进行分类;B选择1个或2个或3个或4个或5个多于一笔的汉字部首与A分类得到的笔画作为组成汉字的基本字元;C将汉字的基本字元定义在键盘相应的键位上;D以部首优先的原则根据汉字的书写顺序取出汉字特定序位上的若干基本字元定义为该汉字的编码,该汉字的编码、内码和汉字储存在电子信息处理器的存贮器中;E电子信息处理器根据D的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字编码,并将所取得的汉字编码组合形成相应数据项的检索码;F检索时,根据C的汉字基本字元在键盘键位上的定义从键盘输入需检索的数据项的依E所定义的检索码。
本发明的第二种技术方案是这样的以汉字字串作检索入口的用户数据库自动编码及键盘检索方法,其特征在于A对汉字的笔画进行分类;B选择1个或2个或3个或4个或5个多于一笔的汉字部首与A分类得到的笔画作为组成汉字的基本字元;C将汉字的基本字元定义在键盘相应的键位上;D以部首优先的原则根据汉字的书写顺序取出汉字特定序位上的若干基本字元定义为该汉字的编码,该汉字的编码隐藏在汉字输入码中,汉字输入码和汉字储存在电子信息处理器的存贮器中;E电子信息处理器根据D的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字编码,并将所取得的汉字编码组合形成相应数据项的检索码;F检索时,根据C的汉字基本字元在键盘键位上的定义从键盘输入需检索的数据项的依E所定义的检索码。
按照上述技术方案,汉字笔画的分类基本是依据汉字的书写及认知习惯进行的。所选择的汉字部首是根据《新华字典》中部首目录来选择。汉字基本字元定义在键盘相应的键位上,该键位可以用相应汉字基本字元进行标示,也可以用字、字母或其他符号进行标示,用基本字元对汉字进行拆分时,部首优先,即在该字不含有部首字元时再用笔画字元。上述技术方案中所称的汉字特定序位上的字元是指根据汉字的笔画书写顺序确定出的该汉字的第1字元、第2字元、——第N字元或者该汉字的末字元。对一个具体的技术方案而言,所称汉字特定序位上的字元究竟某个汉字的第几字元是确定的,当然同一产品中也可以设置多个具体技术方案并存,由用户根据需要选择所需的方案,如一个方案取首字元,另一个方案取首尾字元或者首字元和末字元等。该字元或与汉字基本字元建立对应关系的其他符号系列中对应于该字元的符号均可以定义为相应汉字的编码。需要用到的汉字及其编码和区位码预先储存于有关的电子信息处理器中。如果采用与本发明所述的汉字基本字元一致的拆字输入法输入汉字字串,则汉字编码可以隐藏在该汉字的输入码中,即电子信息处理器自动从该汉字的输入码中取出特定序位上的字元作为其编码。如取出某汉字输入码的头两字元作为该汉字的编码,取出的汉字字串中汉字的编码组合形成相应数据项的检索码,以及根据键盘输入的检索码完成检索功能由软件来实现。由于本发明技术方案设计精巧且对硬件设备要求不高,因而可以应用本发明的电子器具绝非现有的数种。
本发明汉字笔画的基本分类可有以下几种1、汉字的基本笔画可分为“横”,“竖”,“撇”,“捺”,“折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“乙”;其中“点”归在“捺”内。
2、汉字的基本笔画可分为“横”,“竖”,“撇”,“捺”,“顺折”,“反折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“”;收笔时折向为顺时针方向的为“顺折”,反之为“反折”。
3、汉字的基本笔画可分为“横”,“竖”,“撇”,“捺”,“单折”,“多折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“乙”;“单折”为只有一个折弯的“折笔”,“多折”为具有二个或二个以上折弯的“折笔”。3、本发明所述的多于一笔的汉字部首是根据《新华字典》中的部首目录选定的,由于部分部首对降低本发明的重码率不明显,所以一般从下列部首中选择“匚”,“刂”,“冂”,“亻”,“冫”,“冖”,“讠”,“卩”,“阝”“廴”,“凵”,“厶”,“艹”,“扌”,“囗”,“彳”,“彡”,“犭”,“夊”,“饣”,“忄”,“氵”,“宀”,“辶”,“彐”,“纟”,“攵”,“灬”,“礻”,“钅”,“疒”,“衤”,“木”,“王”,“口”,“十”,“厂”,“土”,“山”,“虫”,“日”,“足”,“广”,“门”,“车”,“贝”,“气”,“方”,“月”,“田”,“西”,“雨”,“竹”,“鱼”,等。
本发明汉字基本字元在键位上的分布不受本发明技术方案的限制,完全可以根据具体硬件的特点进行定义,也就是说汉字基本字元在键盘键位上的定义分布是可以变化的。如可以与数字键建立一一对应的关系来定义,也可以两个部首定义在同一数字键上,而笔画与数字键一一对应来定义。
对汉字进行编码时,最好根据以下三种方案来选取某汉字的字元作为其编码1、对汉字进行编码时同时取出汉字的第一个字元和最后一个字元,第一个在前,最后一个在后,两者组合在一起定义为该汉字的编码,对只有一个字元的汉字可以只取该字元或取两次该字元作为汉字的编码。
2、对汉字进行编码时只取出汉字的第一个字元,第一个字元即定义为该汉字的编码。
3、对汉字进行编码时同时取出汉字的第一个字元和第二个字元,第一个在前,第二个在后,两者结合在一起定义为该汉字的编码,对只有一个字元的汉字可以只取该字元或取两次该字元作为汉字的编码。
另外,根据作为数据库检索入口的汉字字串来确定相应数据项的检索码也有多种方案,但大多是由于选取汉字字串的不同数目的汉字而产生的,以下五种方案是最可行的1、根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的每个汉字编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
2、根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的首位汉字和末位汉字的编码,根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
3、根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中前两个汉字的编码,对只有一个汉字的字串只取该汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
4、根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中前三个汉字的编码,对只有一个或二个汉字的字串,取全部汉字的编码,取出的汉字编码根据相应汉字汉字在汉字字串中的顺序组合形成相应数据项的检索码。
5、根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中前四个汉字的编码,对只有一个或二个或三个汉字的字串,取全部汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
虽然本发明检索时的重码率很低,但少量重码现象仍不可避免,此类问题可由软件解决,例如显示出重码的数据项,或进行提示,然后由操作者选择。
本发明考虑到由于手提电话、传呼机等产品的汉字字库不可能将全部汉字都收藏,所以对字库中找不到的汉字,取本发明所述的编码来表示该汉字,也就是说上述两方案中所述的汉字包括相应方案中的基本字元。
下面结合实施例对本发明作进一步说明。
以下实施例中汉字的基本笔画分为“横”,“竖”,“撇”,“捺”,“折”;选择部首“木”,“钅”“氵”与上述笔画组成汉字基本字元,分别用符号“一”,“丨”,“丿”,“丶,”,“乙”,“木”,“钅”“氵”表示,并分别对应定义在键盘上的数字键2,5,4,6,3,7,8,9上(

图1),汉字的编码采用<p>表TV-A
几根VECTRATMB长丝样品也在最佳的温度和时间条件下进行了热处理。结果列在表IV-B中。
权利要求
1.一种以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于A对汉字的笔画进行分类;B选择1个或2个或3个或4个或5个多于一笔的汉字部首与A分类得到的笔画作为组成汉字的基本字元;C将汉字的基本字元定义在键盘相应的键位上;D以部首优先的原则根据汉字的书写顺序取出汉字特定序位上的若干基本字元定义为该汉字的编码,该汉字的编码、内码和汉字储存在电子信息处理器的存贮器中;E电子信息处理器根据D的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字编码,并将所取得的汉字编码组合形成相应数据项的检索码;F检索时,根据C的汉字基本字元在键盘键位上的定义从键盘输入需检索的数据项的依E所定义的检索码。
2.一种以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于A对汉字的笔画进行分类;B选择1个或2个或3个或4个或5个多于一笔的汉字部首与A分类得到的笔画作为组成汉字的基本字元;C将汉字的基本字元定义在键盘相应的键位上;D以部首优先的原则根据汉字的书写顺序取出汉字特定序位上的若干基本字元定义为该汉字的编码,该汉字的编码隐藏在汉字输入码中,汉字输入码和汉字储存在电子信息处理器的存贮器中;E电子信息处理器根据D的汉字编码规则取出作为数据库检索入口而输入到该电子信息处理器中的汉字字串中的若干个汉字编码,并将所取得的汉字编码组合形成相应数据项的检索码;F检索时,根据C的汉字基本字元在键盘键位上的定义从键盘输入需检索的数据项的依E所定义的检索码。
3.根据权利要求1或2所述的以汉字字串作检索入口的数据库的自动编码及键盘检索方法,其特征在于汉字的笔画可分为“横”,“竖”,“撇”,“捺”,“折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“乙”。
4.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”“捺”,“顺折”,“反折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“”;其中“点”归在“捺”内,收笔时折向为顺时针方向的为“顺折”,反之为“反折”。
5.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于汉字的基本笔画可分为“横”,“竖”,“撇”“捺”,“单折”,“多折”;分别用以下符号表示“一”,“丨”,“丿”,“丶”,“”,“乙”;其中“点”归在“捺”内,“单折”为只有一个弯的折笔,“多折”为具有二个或二个以上转弯的折笔。
6.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于所述多于一笔的汉字部首为“匚”,“刂”,“冂”,“亻”,“冫”,“冖”,“讠”,“卩”,“阝”“廴”,“凵”,“厶”,“艹”,“扌”,“囗”,“彳”,“彡”,“犭”,“夊”,“饣”,“忄”,“氵”,“宀”,“辶”,“彐”,“纟”,“攵”,“灬”,“礻”,“钅”,“疒”,“衤”,“木”,“王”,“口”,“十”,“厂”,“土”,“山”,“虫”,“日”,“足”,“广”,“门”,“车”,“贝”,“气”,“方”,“月”,“田”,“西”,“雨”,“竹”,“鱼”,等。
7.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对汉字进行编码时只取出汉字的第一个基本字元,该字元即定义为该汉字的编码。
8.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对汉字进行编码时,取出汉字的第一个和最后一个基本字元,第一个基本字元在前,最后一个基本字元在后,两者组合在一起定义为该汉字的编码;对只有一个字元的汉字只取该字元。
9.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于对汉字进行编码时取出汉字的第一个和第二个基本字元,第一个基本字元在前,第二个基本字元在后,两者组合在一起定义为该汉字的编码;对只有一个字元的汉字只取该字元。
10.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的每个汉字编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
11.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中的首位汉字和末位汉字的编码,根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
12.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中前两个汉字的编码,对只有一个汉字的字串只取该汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
13.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中前三个汉字的编码,对只有一个或二个汉字的字串,取全部汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
14.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于电子信息处理器取出作为数据库检索入口而输入到该电子信息处理器的汉字字串中前四个汉字的编码,对只有一个或二个或三个汉字的字串,取全部汉字的编码,取出的汉字编码根据相应汉字在汉字字串中的顺序组合形成相应数据项的检索码。
15.根据权利要求1或2所述的以汉字字串作检索入口的数据库自动编码及键盘检索方法,其特征在于所述的汉字包括所述组成汉字的基本字元。
全文摘要
一种数据库的自动编码及键盘检索方法,适用于移动电话,传呼机等产品作为中文用户资料的检索方法,其特征主要是用1—5个部首与分类后的笔画组成汉字基本字元,检索码是由作为资料检索入口的汉字字串中若干个字的特定序位上的若干个字元组成,检索过程直观,便捷,无需输入汉字。
文档编号G06F17/30GK1252576SQ9811338
公开日2000年5月10日 申请日期1998年10月23日 优先权日1998年10月23日
发明者麦广树 申请人:麦广树
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1