字串转换检索方法

文档序号:6361481阅读:154来源:国知局
专利名称:字串转换检索方法
技术领域
本发明是有关于一种字串转换检索方法,特别是有关于一种在检索的过程中需要处理具有不同文字内码电子文件的方法。
目前在电子文件的搜寻需求上,通常只要输入一关键字或字串,即可搜寻出具有相关内容的文件。例如只要在某特定网页搜寻引擎的检索栏位上输入待搜寻的关键字,即可检索到具有相关内容的网页。例如,若我们输入的关键字为“二手车”,即可查询到如“城市二手车”、“台湾区二手车服务网”、及“eAuto二手车商情网”等查询结果。然而,目前在检索电子文件内容仅具有单一内码的文字的查询方法。如美国专利6029165中所述的搜寻及检索电子物件的方法及系统,即没有提及有关处理不同内码的问题。
然而,当查询的范围包括使用不同内码的电子文件时,就必须考虑到不同内码转换间所造成的问题,才不会因为搜寻范围过广,而无法达到搜寻的效果,此情况在利用简体中文做为关键字来搜寻以繁体中文为内容的电子文件的情况下显得更为严重。举例来说,当以简体中文“杰”这个字做为关键字检索时,由于其对应于繁体中文的字为“杰”以及“傑”,因此检索结果将包含与“杰”以及“傑”有关的电子文件内容,若以简体中文“肖”这个字做为关键字检索时,由于其对应于繁体中文的字为“肖”以及“簫”,因此检索结果将包含与“肖”以及“簫”有关的电子文件内容,另外还有其他的简体字,也会发生类似的情形,在此不予赘述。如此一来,将会检索出许多与搜寻目的不相关的电子文件,不仅会浪费查询的时间,更使得搜寻的效果大打折扣,显示目前检索方式有特改进。
有鉴于此,本发明的主要目的,在于提供一种字串转换检索方法,能够在检索电子文件时,根据搜寻目的选择做为关键字的具有第一内码的第一字串所对应的具有第二内码的复数第二字串,以缩小搜寻的范围,可避免搜寻结果出现许多无效及不相关的文件,借以增加搜寻的效率。
再者,本发明的另一个目的,在于提供一种字串转换检索方法,能够在检索电子文件时,根据搜寻目的将做为关键字的具有第一内码的第一字串所对应的具有第二内码的复数第二字串加以选择,以缩小搜寻的范围,接着再针对该第二字串所包含的可能的组合加以选择,使得所搜寻的范围能够更加精确,可避免搜寻结果出现许多无效及不相关的文件,借以增加搜寻的效率。
本发明的目的可以通过以下措施来达到一种字串转换检索方法,适用于根据一关键字串搜寻电子文件内容,包括下列步骤输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有第二内码的第二字串,做为上述的关键字串;及根据上述关键字串搜寻电子文件内容。
上述第一字串的型态为简体中文。
上述第二字串的型态为繁体中文。
一种字串转换检索方法,通用于根据一关键字串搜寻电子文件内容,包括下列步骤输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有复数第二内码的复数第二字串;选择上述第二字串之一,作为上述关键字串;及根据上述关键字串搜寻电子文件内容。
上述第一字串的型态为简体中文。
上述第二字串的型态为繁体中文。
提供一资料库,用以储存上述第一字串所对应的上述第二字串,当输入上述第一字串后,提供对应的复数第二字串以供选择。
上述资料库更具有多数常用的词语,用以与上述第二字串作比较,若有吻合,则直接以此吻合的词语做为关键字。
当重复选取上述第二字串达某一既定次数后,于下次输入上述第一字串时,即以上述第二字串作为上述关键字串。
一种字串转换检索方法,适用于根据一关键字串搜寻电子文件内容,包括下列步骤
输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有复数第二内码的复数第二字串;选择上述第二字串之一;提供上述第二字串所对应的多数字词解释;选择上述字词解释之一,作为上述关键字串;根据上述关键字串搜寻电子文件内容。
上述第一字串的型态为简体中文。
上述第二字串的型态为繁体中文。
提供一资料库,用以储存上述第一字串所对应的上述第二字串,当输入上述第一字串后,提供对应的上述第二字串以供选择。
上述资料库更具有多数常用的词语,用以与上述第二字串作比较,若有吻合,则直接以此吻合的词语做为关键字。
当重复选取上述第二字串达某一既定次数后,于下次输入上述第一字串时,即提供上述第二字串所对应的字词解释。当重复选取上述字词解释达某一既定次数后,于下次输入上述第二字串时,即根据上述字词解释作为上述关键字串。
本发明相比现有技术具有如下优点为获致上述的目的,本发明提出一种字串转换检索方法,适用于根据一关键字串搜寻电子文件内容,包括下列步骤输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有复数第二内码的复数第二字串;选择上述第二字串之一;提供上述第二字串所对应的复数字词组合;选择上述字词组合之一,作为上述关键字串;最后根据上述关键字串搜寻电子文件内容。
利用上述的方法,将可避免产生因为字码转换所衍生与搜寻内容无关的搜寻范围。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图示,作详细说明如下

图1是显示有关于本发明第一实施例的流程图;图2是显示有关于本发明第二实施例的流程图。
当我们需要在网路上搜寻具有特定资料的电子文件时,首先必须提供关键字以作为系统搜寻的根据。利用本发明,能够克服目前在搜寻具有多重字码电子文件的情况下所产生搜寻范围不精确的问题。在本发明中,是以将简体中文字形(GB)转换为繁体中文字形(Big5)为例,但不可用以限制本发明的范围,任何因为字码转换而造成搜寻范围扩大的情况都能同理通用,在此先予以说明。以下就第一实施例及第二实施例说明本发明的操作流程。
参阅图1图1是显示有关于本发明第一实施例的流程图。
首先,步骤S11,在搜寻软件的搜寻栏位内输入一第一字串。此第一字串是由操作者根据所欲寻找的内容而输入,而上述的搜寻软件是存在于目前网路上普遍使用的网站如蕃薯藤、奇摩、龙卷风等,在此所搜寻的范围并不仅限于网页内容,更可以包括所有电子文件的内容。步骤S12,提供上述第一字串所对应的第二字串。上述的第二字串是由原本的第一字串转换而成的,但此时通常会存在复数个第二字串,其原因在于目前繁体中文字以及简体中文字的对应关系上,单一简体中文字可能会对应出许多不同的繁体中文字,如简体中文的“杰”,其对应的繁体中文字可为“杰”以及“傑”;又如简体中文的“肖”,其对应的繁体中文字可为“肖”以及“簫”,因此,输入的简体中文词将会产生多种的繁体中文词的组合,也就是上述的第二字串。接下来,在步骤S13中,必须在上述多个第二字串中,选出一个范围与搜寻目标相同的字串,以作为稍后执行的搜寻动作的关键字,借此以排除没有必要的搜寻范围。最后,在步骤S14中,搜寻软件将根据所选取的第二字串做为关键字以执行搜寻的动作。
以上即为根据本发明的第一实施例所述的字串转换检索方法。利用在搜寻之前,先筛选因为转换字串内码所衍生的与检索范围无关的字串,以缩小搜寻的范围,使得检索结果能够更接近搜寻的目标。另外,在步骤则S13的选择第二字串的过程中,除了由使用者选取之外,更可利用预先设计的资料库以简化本实施例的流程,此资料库内含许多大部分常用的词语。将先前所产生的第二字串与资料库中内含的词语作比较,若有吻合者,则直接以此吻合的词语做为关键字,并进入步骤S14执行搜寻的动作,借以简化本实施例的操作流程。
第二实施例与第一实施例的差异在于在筛选的过程中,除了考虑因为转换字串内码所衍生的与检索范围无关的字串,更另外排除具有多种意义的关键字对于搜寻结果的影响。
参阅图2,图2是显示有关于本发明第二实施例的流程图。
首先,步骤S21,在搜寻软件的搜寻栏位内输入一第一字串。此第一字串是由操作者根据所欲寻找的内容而输入,而上述的搜寻软件是存在于目前网路上普遍使用的网站如蕃薯藤、奇摩、龙卷风等,在此所搜寻的范围并不仅限于网页内容,更可以包括所有电子文件的内容。接着在步骤S22提供上述第一字串所对应的第二字串,上述的第二字串是由原本的第一字串转换而成的,但此时通常会存在多个第二字串,其原因在于目前繁体中文字以及简体中文字的对应关系上,单一简体中文字可能会对应出许多不同的繁体中文字,如简体中文的“杰”,其对应的繁体中文字可为“杰”以及“傑”;又如简体中文的“肖”,其对应的繁体中文字可为“肖”以及“簫”,因此,输入的简体中文词将会产生多种的繁体中文词的组合,也就是上述的第二字串。接下来的步骤S23,必须在上述多个第二字串中选出一个范围与搜寻目标较接近的第二字串,借此以排除没有必要的搜寻范围。接着,在步骤S24中,继续提供于步骤S23所选取的第二字串对应的字词解释。例如,以“簫”这个字而论,其相关的意义可以代表草名、寂寞、或者是姓等意思。接着,步骤S25中,根据搜寻目的选出此时该第二字串的字词解释。最后,在步骤S26时,搜寻软件将根据第二字串的字词解释执行搜寻的动作。
以上即为根据本发明的第二实施例所述的字串转换检索方法。利用在搜寻之前,先筛选因为转换字串内码所衍生的与检索范围无关的字串,再根据搜寻目的针对转换后的字串本身所代表的不同意义作一选择,以缩小搜寻的范围,使得检索结果能够更接近搜寻的目标。
同样的,与第一实施例相同,在步骤S23的选择第二字串的过程中,除了由使用者选取之外,更可利用预先设计的资料库以简化本实施例的流程,此资料库内含许多大部分常用的词语。将先前所产生的第二字串与资料库中内含的词语作比较,若有吻合者,则直接以此吻合的词语做为关键字,并进入步骤S24借以简化本实施例的操作流程。
再者,在第一及第二实施例中,如步骤S13、S23及步骤S25中有关选取字串的动作,可根据选取次数的多寡以预测使用者选择的目标。其方法如下由于使用者的习惯以及需要的资料领域大致固定,因此发生多次选取相同的字串或字词解释的机会相当多。因此本发明统计其选取相同的字串或字词解释的次数,当选取次数超过某一特定数量(以下以5次为例)后,当下一次再次以同样的关键字搜寻时,不待使用者选取即可预先设定使用者选取的字串。如当输入简体中文,“肖”时,如上所述,其对应的繁体中文为“肖”及“簫”。若使用者连续5次皆选取“簫”时,当下一次再输入简体中文“肖”时,将会自动转换为繁体中文“簫”,毋需使用者动手操作,但若此时使用者并非属意繁体中文“簫”时,同样可以选择其他对应的字串。
同理,在第二实施例中,同样可以采用上述判断方式。参阅图2的步骤S22至S25,当使用者输入简体中文“肖”时,如上所述,其对应的繁体中文为“肖”及“簫”。若使用者连续5次皆选取“簫”时,当下一次再输入简体中文“肖”时,将会自动转换为繁体中文“簫”。然而,“簫”的意义可以代表草名、寂寞、或者是姓等,若使用者连续5次皆选取“姓”的词义解释时,当下一次再转换为繁体中文“簫”时,将会自动搜寻以“簫”作为关键字并得到以“姓”为主的搜寻结果。如此一来,利用人性化的设计,可以使使用者在操作上较为便利。
本发明虽以较佳实拖例揭露如上,然其并非用以限定本发明,任何熟习此项技艺者,在不脱离本发明的精神和范围内,当可做少许的更动与润饰,因此本发明的保护范围当视后附的申请专利范围所界定为准。
权利要求
1.一种字串转换检索方法,其特征是适用于根据一关键字串搜寻电子文件内容,包括下列步骤输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有第二内码的第二字串,做为上述的关键字串;及根据上述关键字串搜寻电子文件内容。
2.如权利要求1项所述的字串转换检索方法,其特征是其中上述第一字串的型态为简体中文。
3.如权利要求2项所述的字串转换检索方法,其特征是其中上述第二字串的型态为繁体中文。
4.一种字串转换检索方法,其特征是适用于根据一关键字串搜寻电子文件内容,包括下列步骤输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有复数第二内码的复数第二字串;选择上述第二字串之一,作为上述关键字串;及根据上述关键字串搜寻电子文件内容。
5.如权利要求4项所述的字串转换检索方法,其特征是其中上述第一字串的型态为简体中文。
6.如权利要求5项所述的字串转换检索方法,其特征是其中上述第二字串的型态为繁体中文。
7.如权利要求6项所述的字串转换检索方法,其特征是更包括一步骤提供一资料库,用以储存上述第一字串所对应的上述第二字串,当输入上述第一字串后,提供对应的复数第二字串以供选择。
8.如权利要求7项所述的字串转换检索方法,其特征是其中上述资料库更具有多数常用的词语,用以与上述第二字串作比较,若有吻合,则直接以此吻合的词语做为关键字。
9.如权利要求8项所述的字串转换检索方法,其特征是还包括一步骤当重复选取上述第二字串达某一既定次数后,于下次输入上述第一字串时,即以上述第二字串作为上述关键字串。
10.一种字串转换检索方法,其特征是适用于根据一关键字串搜寻电子文件内容,包括下列步骤输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有复数第二内码的复数第二字串;选择上述第二字串之一;提供上述第二字串所对应的多数字词解释;选择上述字词解释之一,作为上述关键字串;根据上述关键字串搜寻电子文件内容。
11.如权利要求10项所述的字串转换检索方法,其特征是其中上述第一字串的型态为简体中文。
12.如权利要求11项所述的字串转换检索方法,其特征是其中上述第二字串的型态为繁体中文。
13.如权利要求12项所述的字串转换检索方法,其特征是更包括一步骤提供一资料库,用以储存上述第一字串所对应的上述第二字串,当输入上述第一字串后,提供对应的上述第二字串以供选择。
14.如权利要求13项所述的字串转换检索方法,其特征是其中上述资料库更具有多数常用的词语,用以与上述第二字串作比较,若有吻合,则直接以此吻合的词语做为关键字。
15.如权利要求14项所述的字串转换检索方法,其特征是更包括一步骤当重复选取上述第二字串达某一既定次数后,于下次输入上述第一字串时,即提供上述第二字串所对应的字词解释。
16,如权利要求15项所述的字串转换检索方法,其特征是更包括一步骤当重复选取上述字词解释达某一既定次数后,于下次输入上述第二字串时,即根据上述字词解释作为上述关键字串。
全文摘要
一种字串转换检索方法,适用于根据一关键字串搜寻电子文件内容,包括下列步骤:输入具有第一内码的第一字串;提供根据上述第一字串所对应的具有第二内码的第二字串,做为上述的关键字串;根据上述关键字串搜寻电子文件内容。利用上述的方法,将可避免产生因为字码转换所衍生与搜寻内容无关的搜寻范围。
文档编号G06F17/30GK1361488SQ00136908
公开日2002年7月31日 申请日期2000年12月28日 优先权日2000年12月28日
发明者赵国仁, 郭正国, 邵弘龙, 杨大庆 申请人:龙卷风科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1