在手持式数据处理装置中进行全文查询的方法

文档序号:6556373阅读:159来源:国知局
专利名称:在手持式数据处理装置中进行全文查询的方法
技术领域
本发明涉及一种全文查询的方法,尤其是一种在手持式数据处理装置中的辞典数据库进行全文查询的方法。
背景技术
半导体制程的进步与消费性电子产业的兴盛,各类数据处理设备如今已深入大众的日常生活。如个人桌上型计算机(Desktop Computer)、笔记型计算机(Note book)、个人数字助理机(Personal Digital Assist)、智能型行动电话(Smart Phone)与电子辞典翻译机等等,带给人们丰富的数字多媒体休闲娱乐生活。
上述的各类产品中,个人数字助理机、智能型行动电话与电子辞典翻译机等类的手持式数据处理装置,最为社会大众所喜爱。手持式数据处理装置的优势在于体积小,不占收藏空间而便于携带,虽说此类产品的扩充性与运算功能无法与传统的个人桌上型计算机等大型产品一较高下,然而其所配备的功能,已足以应付出差在外的商务人士等使用者的一般需求。使用者在学习语言或阅读外文数据时,常会使用到电子产品中的单字查询等功能,此时手持式数据处理装置便于携带使用的优势就更为明显。
虽然手持式数据处理装置能够取代个人桌上型计算机的部分功能,然而手持式数据处理装置大多配备运算处理性能较低的处理器,否则体积将显得庞大沉重,且内藏电池也无法提供长时间的操作使用。当前的手持式数据处理装置,有提供语言翻译的功能,以让使用者随时进行语言学习或者进行单字查询。然而,受限于手持式数据处理装置的运算处理性能,现有的产品大多只能进行单字查询,而无法对使用者所输入的短句进行查询;此外,现有的产品也欠缺对辞典数据库中进行全文查询的功能,使用者仅能得知单字的含意,而无法对含有单字其他例句进行查找,若全文查询的相关查询作业强制执行的话,那么使用者将陷入相当漫长的等待。

发明内容
本发明为解决背景技术存在的上述技术问题,而提供一种在手持式数据处理装置中的辞典数据库进行全文查询的方法及其接口,可大幅提升查询的效率。
本发明的技术解决方案是本发明为一种在手持式数据处理装置中进行全文查询的方法,其特殊之处在于该方法包括以下步骤1)预建含有字词词频列表的数据库;2)读取使用者所输入的短句数据;3)根据字词词频列表,以二分法进行字词拆解;4)将短句数据拆解生成为一个以上的待查找字词数据;5)确认待查找字词数据所对应的索引地址参数;6)然后根据词频参数值的大小将待查找字词数据进行排序;7)确认具有最小词频参数值的待查找字词数据;8)接着,从具有最小词频参数值的待查找字词数据的索引地址参数中获得其所记载的字词说明内容;9)根据该字词说明内容,将字词词频参数值由小至大,对其它的待查找字词数据进行查询;10)生成查询结果字词说明数据;11)显示该查询结果字词说明数据。
上述索引地址参数包括对应辞典数据库的数据库代码值以及数据行数值。
本发明的在手持式数据处理装置中的辞典数据库进行全文查询的方法,是将短句数据拆解成数个待查找字词数据后,从最小的词频参数值进行查询作业,再根据对对应的索引地址参数的提取,生成最后的查询结果字词说明数据,即可得到符合使用者所欲查找的短句数据。因此本发明可高速有效地在运算处理性能较低的手持式数据处理装置上运作,给现有技术中的手持式数据处理装置受限于运算性能,提供其不具备的全文查询功能;即便是运算性能较低的手持式数据处理装置也可轻松应付全文查询的相关处理作业。


图1-3为本发明在手持式数据处理装置中的辞典数据库进行全文查询的使用示意图。
具体实施例方式
本发明提供的手持式数据处理装置中的辞典数据库进行全文查询的方法及其接口,适用于个人数字助理、行动电话与电子辞典翻译机等类的手持式数据处理装置。
本发明的方法的具体流程如下1)预建含有字词词频列表的数据库;2)读取使用者所输入的短句数据;3)根据字词词频列表,以二分法进行字词拆解;4)将短句数据拆解生成为一个以上的待查找字词数据;5)确认待查找字词数据所对应的索引地址参数;6)然后根据词频参数值的大小将待查找字词数据进行排序;7)确认具有最小词频参数值的待查找字词数据;8)接着,从具有最小词频参数值的待查找字词数据的索引地址参数中获得其所记载的字词说明内容;9)根据该字词说明内容,将字词词频参数值由小至大,对其它的待查找字词数据进行查询;10)生成查询结果字词说明数据;11)显示该查询结果字词说明数据。
其中索引地址参数包括对应辞典数据库的数据库代码值以及数据行数值。
参见图1,显示界面上包含有使用者输入字段100,可让使用者输入任意的短句数据,假设输入图标中的“talk about family matters”。
字词拆解显示窗口200包含有字词拆解显示字段201,用来显示待查找字词数据。此待查找字词数据是依据字词词频列表,以二分法进行拆解所产生的,如图标中的“talk about”,“matters”以及“family”。而图标中的“11,36,256等”则为词频显示字段202,此字段用来显示对应待查找字词数据的词频参数值。字词拆解显示窗口200中所显示的数据,是从最小的词频参数值开始依序排列。
参见图2、3,当系统进行运算查询后,将会显示对应的待查找字词数据的字词说明内容,而在字词拆解显示窗口200中,将显示对应待查找字词数据的字词说明内容,并显示对应字词说明内容的索引地址参数203,如图标中的“Ec/Ln471114”。其中的“Ec”为辞典数据库的数据库代码值,而“Ln471114”是辞典数据库中的具体所在行数。“talk about”这个待查找字词数据的词频参数值是最低的,因此就依据“talk about”所对应的索引地址参数,找到对应的字词说明内容204。并在字词说明内容204中,再根据字词词频参数值由小至大,如先对“matters”,再对“family”进行查找。接着在查询结果字词说明显示窗口300中显示筛选过后所生成的查询结果字词说明数据,以及其它关连的说明内容。如此,查询结果中字词说明数据囊括了所有使用者所输入的短句组成。另外,有些单字的变形形式(如talking,talks),这种词在单字全文检索时不参与检索,在短语中参与全文检索。
名词解释1、索引地址参数将字词数据在整个字典的数据库中检索,建立与字词数据对应的索引地址参数,表示字词数据在全文中所在的位置。
2、词频参数值待查找字词数据在数据中出现的次数,由PC在全文检索之前作预处理,得到字词出现的频率值。
权利要求
1.一种在手持式数据处理装置中进行全文查询的方法,其特征在于该方法包括以下步骤1)预建含有字词词频列表的数据库;2)读取使用者所输入的短句数据;3)根据字词词频列表,以二分法进行字词拆解;4)将短句数据拆解生成为一个以上的待查找字词数据;5)确认待查找字词数据所对应的索引地址参数;6)然后根据词频参数值的大小将待查找字词数据进行排序;7)确认具有最小词频参数值的待查找字词数据;8)接着,从具有最小词频参数值的待查找字词数据的索引地址参数中获得其所记载的字词说明内容;9)根据该字词说明内容,将字词词频参数值由小至大,对其它的待查找字词数据进行查询;10)生成查询结果字词说明数据;11)显示该查询结果字词说明数据。
2.根据权利要求1所述的在手持式数据处理装置中进行全文查询的方法,其特征在于所述索引地址参数包括对应辞典数据库的数据库代码值以及数据行数值。
全文摘要
本发明涉及一种全文查询的方法,尤其是一种在手持式数据处理装置中的辞典数据库进行全文查询的方法。该方法包括以下步骤1)预建数据库;2)读取数据;3)字词拆解;4)拆解生成待查找字词数据;5)确认索引地址参数;6)将待查找字词数据进行排序;7)确认待查找字词数据;8)从索引地址参数中获得字词说明内容;9)对其它的待查找字词数据进行查询;10)生成查询结果;11)显示说明数据。本发明可高速有效地在运算处理性能较低的手持式数据处理装置上运作,给现有技术中的手持式数据处理装置受限于运算性能,提供其不具备的全文查询功能。
文档编号G06F17/30GK1851707SQ200610042850
公开日2006年10月25日 申请日期2006年5月22日 优先权日2006年5月22日
发明者陈淮琰, 蒋阳安 申请人:无敌科技(西安)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1