基于浏览器的资源检索方法与流程

文档序号:14686186发布日期:2018-06-14 23:45阅读:250来源:国知局

本发明涉及资源检索方法,更具体地,涉及基于浏览器的资源检索方法。



背景技术:

目前,随着计算机和网络应用的日益广泛以及不同领域的业务种类的日益丰富,针对对目标数据以及应用资源进行精确检索变得越来越重要。

在现有的技术方案中,通常仅能根据用户输入的关键词进行数据资源的查找,而针对应用程序,只能通过应用程序的入口链接来人工选择。

由上可见,上述现有的技术方案存在如下问题:难于实现对应用程序或数据资源的高效、精确检索。

因此,存在如下需求:提供能够高效并精确地对应用程序资源和数据资源进行检索的基于浏览器的资源检索方法。



技术实现要素:

为了解决上述现有技术方案所存在的问题,本发明提出了能够高效并精确地对应用程序资源和数据资源进行检索的基于浏览器的资源检索方法。

本发明的目的是通过以下技术方案实现的:

一种基于浏览器的资源检索方法,所述基于浏览器的资源检索方法包括下列步骤:

(A1)从浏览器中的搜索框中接收用户输入的关键词;

(A2)分析所述关键词,并基于预定的相关性和匹配算法检索资源池中的数据和/或应用程序;

(A3)在所述浏览器中显示检索结果以供用户查看和选择,其中,所述检索结果包括数据检索结果和应用程序检索结果,并且所述应用程序检索结果以应用框的形式呈现。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:用户直接使用所选择的应用程序的应用框执行该应用程序所提供的业务功能。

在上面所公开的方案中,优选地,所述应用框是嵌入式轻应用框架。

在上面所公开的方案中,优选地,所述步骤(A2)进一步包括:基于下列方式中的一个或多个对所述关键词进行分析:语义分析、行为分析、权限分析、以及基于人机交互的分析。

在上面所公开的方案中,优选地,以如下方式构建所述资源池:根据预定的数据源统一接入规范从目标数据源采集数据、根据预定的应用程序统一接入规范接入一个或多个应用程序、通过网页爬虫方式采集目标网页。

在上面所公开的方案中,优选地,所述方法进一步包括:在用户触发检索之前通过登录的方式验证用户身份以确定用户权限。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:按照排序基准的值以排序的方式显示所述检索结果,其中,所述排序基准包括单个字段或者多个字段,并且当使用多个字段作为排序基准时将所述多个字段组成排序向量,并且在排序向量中排序优先级从左到右依次降低。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:所述排序基准进一步包括“相关度”,即“相关度”作为一个字段被包含在所述排序向量中。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:针对多值字段,将多个字段值按照其存储顺序用分隔符拼接成单一值参与排序。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:按照后进先出的方式排序所述检索结果以用于显示。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:基于词频、逆文档频率以及文档的规范化长度计算所述检索结果中的纪录的相关度。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:基于下列中的一种或多种方式对计算出的相关度进行加权:(1)标题加权;(2)相对位置加权;(3)分支加权;(4)记录级加权。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:基于命中词单位向量长度对计算出的相关度进行加权,即用一个记录中命中词的单位向量长度作为记录的相关度。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:针对多字段排序基准,将该排序基准中的多个字段的相关度进行加权求和后的综合值对应排序向量中的唯一分量进行排序操作。

在上面所公开的方案中,优选地,所述步骤(A3)进一步包括:在对计算出的相关度进行加权时考虑纪录的时间因素。

在上面所公开的方案中,优选地,所述方法能够实现针对检索结果的TOPN模式排序,其包含TOPN部分排序模式,即排序后的结果集只有前N个记录是有序的,其余的记录虽然也被保留,但是是无序的,以及TOPN剪裁排序模式,即排序后的结果集只保留前N个有序的记录,其余的记录被丢弃。

在上面所公开的方案中,优选地,所述方法能够实现针对检索结果的以汉语拼音和汉字笔画为基础的中文排序。

本发明所公开的基于浏览器的资源检索方法具有以下优点:能够高效并精确地对应用程序资源和数据资源进行检索并进行排序分析。

附图说明

结合附图,本发明的技术特征以及优点将会被本领域技术人员更好地理解,其中:

图1是根据本发明的实施例的基于浏览器的资源检索方法的流程图。

具体实施方式

图1是根据本发明的实施例的基于浏览器的资源检索方法的流程图。如图1所示,本发明所公开的基于浏览器的资源检索方法包括下列步骤:(A1)从浏览器中的搜索框中接收用户输入的关键词;(A2)分析所述关键词,并基于预定的相关性和匹配算法检索资源池中的数据和/或应用程序;(A3)在所述浏览器中显示检索结果以供用户查看和选择,其中,所述检索结果包括数据检索结果和应用程序检索结果,并且所述应用程序检索结果以应用框的形式呈现。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:用户直接使用所选择的应用程序的应用框执行该应用程序所提供的业务功能。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述应用框是嵌入式轻应用框架(即嵌入浏览器中的能够实施基本业务功能的应用程序框架)。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A2)进一步包括:基于下列方式中的一个或多个对所述关键词进行分析:语义分析、行为分析、权限分析、以及基于人机交互的分析。

优选地,在本发明所公开的基于浏览器的资源检索方法中,以如下方式构建所述资源池:根据预定的数据源统一接入规范从目标数据源(例如数据库)采集数据(即建立数据索引)、根据预定的应用程序统一接入规范接入一个或多个应用程序(即建立应用程序框架索引)、通过网页爬虫方式采集目标网页(即建立目标网页索引)。

优选地,本发明所公开的基于浏览器的资源检索方法进一步包括:在用户触发检索之前通过登录的方式验证用户身份以确定用户权限。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:按照排序基准的值以排序的方式显示所述检索结果,其中,所述排序基准包括单个字段或者多个字段,并且当使用多个字段作为排序基准时将所述多个字段组成排序向量,并且在排序向量中排序优先级从左到右依次降低(即最左边的字段最先排序,最右边的字段最后排序。只有当一个字段有多个记录具有相同的值时,才会对该字段右边的字段继续排序)。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:所述排序基准进一步包括“相关度”,即“相关度”作为一个字段被包含在所述排序向量中(由于各个记录之间很少会有相同的相关度,所以排在相关度右边的字段在排序时所起的作用可能不大。示例性地,相关性固定采用按降序排列,而字段值则可以指定是按升序排列,还是按降序排列)。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:针对多值字段,将多个字段值按照其存储顺序用分隔符拼接成单一值参与排序。

可选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:按照后进先出(LIFO)的方式排序所述检索结果以用于显示。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:基于词频(词在文档出现的次数)、逆文档频率(总文档数与命中文档数之比)以及文档的规范化长度计算所述检索结果中的纪录的相关度。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:基于下列中的一种或多种方式对计算出的相关度进行加权:(1)标题加权(此处所指的标题不是一个字段,而是数据资源的开始部分(例如第一句话),即对出现在标题里的命中点,应用可以指定相应的加权系数);(2)相对位置加权(即考虑命中点之间的距离因素,使得来自于短语的命中点具有更高的相关性权重);(3)分支加权(即对表达式中的分支(叶子节点)命中情况,以及LIKE和INCLUDE函数的“符合度”进行加权;(4)记录级加权(即每个记录都事先赋予了一个相关性权值,以一个字段值的形式和记录的其它字段数据一起存入数据库中,并要求在进行相关性排序时,将这个权值乘以相关度模型的计算结果后作为该记录的相关度)。

可选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:基于命中词单位向量长度对计算出的相关度进行加权,即用一个记录中命中词的单位向量长度(每个命中词只计算一次)作为记录的相关度(由此,含命中词的个数(不是词出现的次数)越多的记录,其相关度越大)。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:针对多字段排序基准,将该排序基准中的多个字段的相关度进行加权求和后的综合值对应排序向量中的唯一(相关性)分量进行排序操作(其中,除缺省检索字段外,其它字段要参与相关性排序,必须打开字段的“相关性开关”,并在检索时指定该字段的权重,即使检索只涉及一个字段时,也必须指定。但如果检索时所有涉及的字段都未显式地指定权重,且缺省检索字段又是检索所涉及的字段之一,则只计算缺省检索字段上的相关度,并进行相关性排序。对于多字段的相关性排序,仅仅通过对字段进行加权的方法有时还不足以满足所有应用的需求,因此提供了另一种选择,即允许规定字段的排序优先级,实现按字段分别进行相关性排序。此功能的使用方法如下:在提交检索请求时指定“按字段分别进行相关性排序”的参数,同时按上述方式指定字段的“权重”,此处的“权重”仅仅代表字段之间相对的排序优先顺序,不再有绝对值意义,“权重”越大,排序越优先)。

优选地,在本发明所公开的基于浏览器的资源检索方法中,所述步骤(A3)进一步包括:在对计算出的相关度进行加权时考虑纪录的时间因素(即一条数据纪录的重要性会随着时间的推移而逐渐降低)。

优选地,本发明所公开的基于浏览器的资源检索方法能够实现针对检索结果的TOPN模式排序,其包含TOPN部分排序模式,即排序后的结果集只有前N个记录是有序的(指定的顺序),其余的记录虽然也被保留,但是是无序的,以及TOPN剪裁排序模式,即排序后的结果集只保留(即存储)前N个有序的(指定的顺序)记录,其余的记录被丢弃(其中,TOPN部分排序模式受系统的“最大排序记录数”控制,即当检索结果记录数超出“最大排序记录数”时,TOPN部分排序模式不起作用;而当检索结果记录数小于“最大排序记录数”时,排序结果只保证前N个记录是有序的(记录数不发生变化)。此外,TOPN剪裁排序模式被划分为如下两种情况:第一种剪裁排序是与检索操作一起提交的排序,此时如果检索结果记录数超出“最大排序记录数”,则只在先检索到的“最大排序记录数”个记录中剪裁并保留前N个有序(指定的顺序)的记录,其余的记录根本不参与排序过程(因此在这种情况下,不同的“最大排序记录数”就有可能得到不同的排序结果,不同的检索完成顺序也有可能得到不同的排序结果);第二种剪裁排序是在检索操作之后的单独排序,这种情况和TOPN部分排序模式一样受系统的“最大排序记录数”控制,即当检索结果记录数超出“最大排序记录数”时,TOPN剪裁排序模式将不起作用,否则排序后的结果集只保留前N个有序的记录(记录数将发生变化))。

优选地,本发明所公开的基于浏览器的资源检索方法能够实现针对检索结果的以汉语拼音和汉字笔画为基础的中文排序。

由上可见,本发明所公开的基于浏览器的资源检索方法具有下列优点:能够高效并精确地对应用程序资源和数据资源进行检索并进行排序分析。

尽管本发明是通过上述的优选实施方式进行描述的,但是其实现形式并不局限于上述的实施方式。应该认识到:在不脱离本发明主旨和范围的情况下,本领域技术人员可以对本发明做出不同的变化和修改。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1