基于搜索引擎的信息检索方法、装置、设备和存储介质与流程

文档序号:19251180发布日期:2019-11-27 20:15阅读:176来源:国知局
基于搜索引擎的信息检索方法、装置、设备和存储介质与流程

本发明涉及信息处理领域,尤其涉及基于搜索引擎的信息检索方法、装置、设备和存储介质。



背景技术:

随着互联网的迅猛发展、网络信息的增加,为了实现快速地信息查找,搜索引擎随之诞生。

搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将互联网intenet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。现有的搜索引擎中无法满足用户个性化的数据检索需求。



技术实现要素:

本发明的主要目的在于提供一种基于搜索引擎的信息检索方法、装置、设备和存储介质,旨在解决当前搜索引擎无法灵活、准确地进行信息检索的技术问题。

为实现上述目的,本发明提供基于搜索引擎的信息检索方法,所述基于搜索引擎的信息检索方法包括以下步骤:

在接收到信息检索请求时,获取所述信息检索请求对应的检索信息和账户标识;

根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法;

根据所述检索信息和所述目标检索算法进行信息检索,得到与所述检索信息匹配的第一检索结果;

将所述第一检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看。

可选地,所述根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法的步骤,包括:

获取所述检索信息的信息类型,查询预设算法推荐表,获取所述信息类型对应的第一检索算法;

获取所述账户标识对应的各预设检索算法的历史评分,并将历史评分最高的预设检索算法作为第二检索算法;

在所述第一检索算法和所述第二检索算法不同时,将所述第一检索算法和第二检索算法中优先级高的作为所述信息检索请求对应的目标检索算法。

可选地,所述将所述第一检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看的步骤之后,包括:

接收所述终端发送的基于所述第一检索结果的用户行为数据,其中,所述用户行为数据包括:浏览时间和浏览频率;

获取所述用户行为数据包含的对所述第一检索结果中各检索条目的浏览时间、浏览频率,将浏览时间最长或浏览频率最高的检索条目作为真实命中信息;

按除所述目标检索算法之外的预设检索算法进行信息检索,得到与所述检索信息匹配的第二检索结果;

根据所述真实命中信息、所述第一检索结果和所述第二检索结果,更新各预设检索算法的历史评分。

可选地,所述根据所述真实命中信息、所述第一检索结果和所述第二检索结果,更新各预设检索算法的历史评分的步骤,包括:

获取所述真实命中信息在所述第一检索结果和所述第二检索结果中的排序,获取排序最先的目标检索结果;

调整所述目标检索结果对应的检索算法的评分,以完成历史评分的更新。

可选地,所述根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法的步骤之后,包括:

在所述目标检索算法配置完成之后,判断是否存在至少两个预设数据库;

若存在至少两个预设数据库,则获取各个预设数据库的访问频率,将所述访问频率最高的预设数据库作为信息检索请求对应的目标数据库。

可选地,所述根据所述检索信息和所述目标检索算法进行信息检索,得到与所述检索信息匹配的第一检索结果的步骤,包括:

将所述检索信息按所述目标检索算法中的分词算法进行分词处理,得到所述检索信息对应的关键词集合;

查询所述目标数据库,按所述目标检索算法中的相似度算法,获取与所述关键词集合匹配的检索条目,并排列各所述检索条目得到第一检索结果。

可选地,所述在接收到信息检索请求时,获取所述信息检索请求对应的检索信息和账户标识的步骤之后,包括:

获取所述账户标识的历史检索记录,将所述历史检索记录中的各历史检索结果与所述检索信息进行比较,判断所述历史检索记录中是否存在与所述检索信息匹配的历史检索结果

在存在与所述检索信息匹配的历史检索结果时,将所述历史检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看;

在不存在与所述检索信息匹配的历史检索结果时,执行步骤:根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法。

此外,为实现上述目的,本发明还提供一种基于搜索引擎的信息检索装置,所述基于搜索引擎的信息检索装置包括:

请求接收模块,用于在接收到信息检索请求时,获取所述信息检索请求对应的检索信息和账户标识;

算法配置模块,用于根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法;

信息检索模块,用于根据所述检索信息和所述目标检索算法进行信息检索,得到与所述检索信息匹配的第一检索结果;

结果发送模块,用于将所述第一检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看。

此外,为实现上述目的,本发明还提供一种基于搜索引擎的信息检索设备;

所述基于搜索引擎的信息检索设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:

所述计算机程序被所述处理器执行时实现如上所述的基于搜索引擎的信息检索方法的步骤。

此外,为实现上述目的,本发明还提供计算机存储介质;

所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的基于搜索引擎的信息检索方法的步骤。

本发明实施例提出的一种基于搜索引擎的信息检索方法、装置、设备和存储介质,在服务器接收到信息检索请求时,获取所述信息检索请求对应的检索信息和账户标识;根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法;根据所述检索信息和所述目标检索算法进行信息检索,得到与所述检索信息匹配的第一检索结果;将所述第一检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看。本发明中搜索引擎对应服务器根据检索信息和账户标识灵活配置目标检索算法,即,本发明中服务器根据实时检索信息和账户标识对应检索账户的历史检索记录,灵活地配置目标检索算法,并按目标检索算法进行信息检索,提高了信息检索的灵活性和准确性,满足了信息检索的个性化需求。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;

图2为本发明基于搜索引擎的信息检索方法第一实施例的流程示意图;

图3为本发明基于搜索引擎的信息检索装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的服务器(又叫基于搜索引擎的信息检索设备,其中,基于搜索引擎的信息检索设备可以是由单独的基于搜索引擎的信息检索装置构成,也可以是由其他装置与基于搜索引擎的信息检索装置组合形成)结构示意图。

本发明实施例服务器指一个管理资源并为用户提供服务的计算机,通常分为文件服务器、数据库服务器和应用程序服务器。运行以上软件的计算机或计算机系统也被称为服务器。相对于普通pc(personalcomputer)个人计算机来说,服务器在稳定性、安全性、性能等方面都要求较高;如图1所示,该服务器可以包括:处理器1001,例如中央处理器(centralprocessingunit,cpu),网络接口1004,用户接口1003,存储器1005,通信总线1002、芯片组、磁盘系统、网络等硬件等。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真wireless-fidelity,wifi接口)。存储器1005可以是高速随机存取存储器(randomaccessmemory,ram),也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地,服务器还可以包括摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wifi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除wifi外,蓝牙、探针等。本领域技术人员可以理解,图1中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,存储介质可以是非易失性可读存储介质,如ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。

在图1所示的服务器中,网络接口1004主要用于连接后台数据库,与后台数据库进行数据通信;用户接口1003主要用于连接客户端(客户端,又叫用户端或终端,本发明实施例终端可以固定终端也可以是移动终端,如,带联网功能的智能空调、智能电灯、智能电源、智能音箱、自动驾驶汽车、pc、智能手机、平板电脑、电子书阅读器、便携计算机等,终端中包含传感器比如光传感器、运动传感器以及其他传感器,在此不再赘述),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的基于搜索引擎的信息检索方法中的步骤。

本实施例提供一种基于搜索引擎的信息检索方法,该基于搜索引擎的信息检索方法应用于如图1所示的搜索引擎对应服务器,本申请中的搜索引擎针对aiml(全名为artificialintelligencemarkuplanguage(人工智能标记语言),aiml是一种创建自然语言软件代理的xml语言)规范使用java开发语言得到的,可以更好地与不同的应用软件进行对接,实现高效准确地信息检索,具体地:

参照图2,在本发明基于搜索引擎的信息检索方法的第一实施例中,所述基于搜索引擎的信息检索方法包括:

步骤s10,在接收到信息检索请求时,获取所述信息检索请求对应的检索信息和账户标识。

搜索引擎对应的服务器接收到信息检索请求时,服务器获取信息检索请求中携带的检索信息(检索信息可以理解为用户输入的查询信息)和账户标识(账户标识是指唯一识别用户的标识信息,例如,检索客户账号)。

可以理解的是,本实施例中服务器接收到的信息检索请求的触发形式不作具体限定,即,信息检索请求可以是用户主动触发的,例如,用户基于终端语音或者文字输入:“附近好吃的饭店有哪些”触发信息检索请求,终端将信息检索请求发送至服务器,服务器接收到信息检索请求,服务器将“附近好吃的饭店有哪些”作为检索信息,服务器将信息检索请求中的账号名称作为账户标识;或者,信息检索请求还可以是自动触发的,例如,用户预先在终端中设置每日早晨8点自动播报天气预报,终端在每日早晨8点自动触发信息检索请求,服务器接收到信息检索请求,服务器将“天气预报”作为检索信息,服务器将信息检索请求中的账号名称作为账户标识。

步骤s20,根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法。

服务器根据检索信息和账户标识配置目标检索算法,具体地,包括:

服务器根据检索信息确定第一检索算法,即,服务器查询各个预设检索算法处理该检索信息效率,服务器将效率最高的检索算法作为第一检索算法,例如,检索信息为:“如何提高写作效率”,服务器按正则检索算法进行检索的检索时间为0.5秒,服务器按照机器学习检索算法进行检索的检索时间为1秒,则服务器将正则检索算法作为第一检索算法。

服务器根据账户标识确定第二检索算法,即,服务器中预先根据历史检索记录设置不同账户类型对应的检索算法,在服务器获取该账户标识对应的账户类型,然后获取该账户类型对应的检索算法作为第二检索算法;例如,账户标识为xxx,对应的账户类型为二级账户类型,服务器获取二级账户类型对应的机器学习检索算法,服务器将机器学习检索算法作为第二检索算法。

在服务器确定第一检索算法和第二检索算法之后,服务器判断第一检索算法和第二检索算法是否相同,在第一检索算法与第二检索算法相同时,服务器直接进行检索,在第一检索算法与第二检索算法不同时,服务器获取第一检索算法对应的第一优先级,和第二检索算法对应的第二优先级,若第一优先级高于第二优先级,则服务器将第一检索算法作为目标检索算法,反之。

需要补充说明的是检索算法的优先级,可以是预先设置的,还可以根据应用场景具体设置,本实施例中不作限定。

步骤s30,根据所述检索信息和所述目标检索算法进行信息检索,得到与所述检索信息匹配的第一检索结果。

在服务器确定目标检索算法之后,服务器按目标检索算法处理检索信息,并得到第一检索结果,例如,服务器按目标检索算法中的分词算法对检索信息进行分词处理,得到检索信息对应的关键词集合;然后,服务器查询预设数据库(预设数据库是指预先设置的包含不同信息类型的数据库,预设数据库可以是通过检索程序(indexer),俗称“蜘蛛”(spider)程序或“机器人”(robot)程序,建立的网页数据库;或者,预设数据库还可以是预先建立其他类型的数据库),服务器按目标检索算法中的相似度算法,将检索信息与预设数据库中包含的预设信息进行比较,获取与关键词集合匹配的检索条目,并排列各检索条目得到第一检索结果。

步骤s40,将所述第一检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看。

服务器在得到第一检索结果之后,服务器将第一检索结果发送至账户标识对应的终端,以使终端对应用户查看检索结果。本发明中搜索引擎对应服务器根据检索信息和账户标识灵活配置目标检索算法,即,本发明中服务器根据实时检索信息和账户标识对应检索账户的历史检索记录,灵活地配置目标检索算法,并按目标检索算法进行信息检索,提高了信息检索的灵活性和准确性,满足了信息检索的个性化需求。

进一步地,在本发明第一实施例的基础上,提出了本发明基于搜索引擎的信息检索方法的第二实施例。

本实施例是第一实施例中步骤s20的细化,本实施例中具体说明了一种配置目标检索算法的方案,所述基于搜索引擎的信息检索方法包括:

步骤s21,获取所述检索信息的信息类型,查询预设算法推荐表,获取所述信息类型对应的第一检索算法。

服务器获取检索信息的信息类型,信息类型是指将检索信息按信息性质、信息内容或者信息作用等进行分类得到的信息种类,例如,服务器按信息内容将检索信息可以分为:消息类型、资料类型和知识类型。然后,服务器查询预设算法推荐表,获取预设算法推荐表中信息类型对应的第一检索算法。

预设算法推荐表是指预先设置的信息类型与检索算法映射表,例如,服务器根据历史检索记录统计得到:资料类型的检索信息检索准确率最高的算法为正则匹配算法,则预设算法推荐表中将资料类型的检索信息与正则匹配算法建立映射关系;再比如,服务器根据历史检索记录统计得到:消息类型的检索信息检索准确率最高的算法为机器学习检索算法,则预设算法推荐表中将消息类型的检索信息与机器学习检索算法建立映射关系。

步骤s22,获取所述账户标识对应的各预设检索算法的历史评分,并将历史评分最高的预设检索算法作为第二检索算法。

服务器获取账户标识对应的各预设检索算法的历史评分,即,服务器中预先设置有多个检索算法,如,正则匹配算法和机器学习检索算法等等,服务器获取账户标识为王xx对应的:正则匹配算法的历史评定为8分、机器学习检索算法的历史评分为6分,服务器将正则匹配算法作为第二检索算法。

可以理解的是:相同的预设检索算法在不同的账户标识对应的历史评分并不一定相同,即,预设检索算法的历史评分是根据用户的历史检索记录得到的:例如,服务器中设置有中预设检索算法p(正则检索算法)和预设检索算法q(机器学习检索算法),该账户标识1有3次历史检索记录:

第一次历史检索记录中预设检索算法p输出的检索结果排序为a1和a2;预设检索算法q输出的检索结果排序为a2和a1;用户真实命中信息为a1;则服务器将预设检索算法p的历史评分更新为0+1,将预设检索算法q的评分保持不变为0;

第二次历史检索记录中预设检索算法p输出的检索结果排序为b1和b2;预设检索算法q输出的检索结果排序为b2和b1;用户真实命中信息为b2;则服务器将预设检索算法p的历史评分保持不变为1,将预设检索算法q的历史评分更新为0+1;

第三次历史检索记录中预设检索算法p输出的检索结果排序为c1和c2;预设检索算法q输出的检索结果排序为c2和c1;用户真实命中信息为c1;服务器将预设检索算法p的历史评分更新为1+1=2,将预设检索算法q的历史评分保持不变为1;服务器按照历史检索记录确定预设检索算法p的历史评分为2分,预设检索算法q历史评分为1分。服务器将预设检索算法p作为的目标检索算法。

在服务器确定第一检索算法和第二检索算法之后,服务器判断第一检索算法与第二检索算法是否相同,在第一检索算法和第二检索算法相同时,服务器按确定的检索算法进行检索。

步骤s23,在所述第一检索算法和所述第二检索算法不同时,将所述第一检索算法和第二检索算法中优先级高的作为所述信息检索请求对应的目标检索算法。

在服务器确定第一检索算法和第二检索算法不同时,服务器获取第一检索算法的第一优先级和第二检索算法的第二优先级,其中,检索算法的优先级,可以是预先设置的,还可以是服务器根据检索场景灵活设置的;然后,服务器比较第一优先级和第二优先级,服务器将第一检索算法和第二检索算法中优先级高的作为信息检索请求对应的目标检索算法。

在本实施例中服务器根据检索信息和账户标识配置目标检索算法,有效地保证的目标检索算法设置的灵活性,使得服务器根据不用的用户设置不同的检索算法,实现了的索引擎和检索算法实现解耦。

进一步地,在本发明第二实施例的基础上,提出了本发明基于搜索引擎的信息检索方法的第三实施例。

本实施例中服务器对第二实施例中步骤s22涉及到的检索算法历史评分进行自动更新,所述基于搜索引擎的信息检索方法包括:

步骤s50,接收所述终端发送的基于所述第一检索结果的用户行为数据,获取所述用户行为数据包含的对所述第一检索结果中各检索条目的浏览时间、浏览频率,将浏览时间最长或浏览频率最高的检索条目作为真实命中信息。

服务器将第一检索结果发送至账户标识对应的终端,以使终端用户查看第一检索结果,终端采集用户基于第一检索结果的用户行为数据,终端将采集的用户行为数据反馈至服务器,服务器接收终端发送的基于第一检索结果的用户行为数据,例如,服务器将第一检索结果10篇“如何提高写作效率”相关的文件发送至终端,用户在终端上点击第二篇一次浏览时间为20秒,用户在终端上点击第五篇一次浏览时间为90秒,终端采集用户行为数据(用户行为数据包括:浏览时间和浏览频率),并将用户行为数据发送至服务器。

服务器获取用户行为数据对应的第一检索结果中各检索条目的浏览时间、浏览频率,即,服务器对用户行为数据进行分析,服务器将浏览时间最长或浏览频率最高的检索条目作为真实命中信息。例如,服务器第五篇文章作为真实命中信息。

步骤s60,按除所述目标检索算法之外的预设检索算法进行信息检索,得到与所述检索信息匹配的第二检索结果。

在服务器确定真实命中信息之后,服务器用除目标检索算法之外的预设检索算法进行信息检索,得到与检索信息匹配的第二检索结果,可以理解的是预设检索算法可以包括一个或者多个,此外,服务器按照检索算法进行信息检索可以参照第一实施例,本实施例中不作赘述。

步骤s70,根据所述真实命中信息、所述第一检索结果和所述第二检索结果,更新各预设检索算法的历史评分。

具体地,服务器更新各个预设检索算法的历史评分更新的步骤包括:

步骤a,获取所述真实命中信息在所述第一检索结果和所述第二检索结果中的排序,获取排序最先的目标检索结果;

步骤b,调整所述目标检索结果对应的检索算法的评分,以完成历史评分的更新。

例如,目标检索算法为p,除目标检索算法为p之外还包括预设检索算法q和s,服务器按照目标检索算法p得到的第一检索结果排序为a1、a2和a3;服务器按照预设检索算法q得到的第二检索结果排序为a2、a3和a1;服务器按照预设检索算法s得到的第二检索结果排序为a3、a2和a2;用户真实命中信息为a2;则服务器根据真实命中信息在第一检索结果和第二检索结果中的排序,服务器将预设检索算法q的历史评分+1,服务器保持目标检索算法p和预设检索算法s的历史评分不作调整,以更新服务器中账户标识对的各个检索算法的历史检索评分。

在本实施例中服务器在每次检索的过程中都根据用户的浏览情况,更新账户标识对应的各个预设检索算法的历史评分,使得根据历史评分确定的检索算法更加合理。

进一步地,在本发明上述实施例的基础上,提出了本发明基于搜索引擎的信息检索方法的第四实施例。

本实施例是第一实施例中步骤s30之后的步骤,在本发明第四实施例中说明了服务器配置检索的目标数据库,使得信息检索更加全面。所述基于搜索引擎的信息检索方法包括:

步骤s80,在所述目标检索算法配置完成之后,判断是否存在至少两个预设数据库。

在服务器目标检索算法配置完成之后,服务器判断是否存在至少两个预设数据库,即,本实施例中检索对应的预设数据库可以是一个,还可以是多个,若只存在一个预设数据库,则服务器按照目标检索算法对预设数据库进行检索。

步骤s90,若存在至少两个预设数据库,则获取各个预设数据库的访问频率,将所述访问频率最高的预设数据库作为信息检索请求对应的目标数据库。

若存在至少两个预设数据库,则服务器获取各个预设数据库的访问频率,服务器将访问频率最高的预设数据库作为信息检索请求对应的目标数据库,与对目标库进行检索。需要补充说明的是:本实施例中服务器还可以根据各个预设数据库中的信息量,或者预设数据库的更新信息,确定目标数据库,在此不作说明。

本实施例中在确定目标数据库之后,服务器执行第一实施例中步骤s40的步骤,服务器对目标数据库进行检索,包括:

步骤s41,将所述检索信息按所述目标检索算法中的分词算法进行分词处理,得到所述检索信息对应的关键词集合。

服务器将检索信息按目标检索算法中的分词算法进行分词处理,即,服务器确定检索信息中的冗余信息保留关键信息,得到检索信息对应的关键词集合。

步骤s42,查询所述目标数据库,按所述目标检索算法中的相似度算法,获取与所述关键词集合匹配的检索条目,并排列各所述检索条目得到第一检索结果。

服务器查询目标数据库,服务器获取目标检索算法中的相似度算法,服务器按照相似度算法,将关键字集合中的关键字与目数据库中的预设信息进行比对,服务器将相似度高于80%的信息作为与关键词集合匹配的检索条目,服务器根据相对度的高低排列各所述检索条目得到第一检索结果。

本实施例中在搜索引擎对应服务器可以调用多个预设数据库的数据信息时,服务器根据预设数据库的信息,确定目标数据库,可以保证信息检索更加全面。

进一步地,在本发明上述实施例的基础上,提出了本发明基于搜索引擎的信息检索方法的第五实施例。

本实施例是第一实施例中步骤s10的之后的步骤,本实施例在获取到检索信息和账户标识之后,服务器判断是否存在历史检索记录,具体地,所述基于搜索引擎的信息检索方法包括:

步骤s100,获取所述账户标识的历史检索记录,将所述历史检索记录中的各历史检索结果与所述检索信息进行比较,判断所述历史检索记录中是否存在与所述检索信息匹配的历史检索结果。

服务器获取账户标识的历史检索记录,其中,历史检索记录账户标识对应用户的历史检索信息,服务器将历史检索记录中的各历史检索结果与检索信息进行比较,判断历史检索记录中是否存在与检索信息匹配的历史检索结果。

步骤s110,在存在与所述检索信息匹配的历史检索结果时,将所述历史检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看。

在服务器判定存在与检索信息匹配的历史检索结果时,服务器将历史检索结果发送至账户标识对应的终端,以供终端对应用户查看;在服务器判定不存在与检索信息匹配的历史检索结果时,执行步骤:第一实施例中步骤s20:根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法。在本实施例中在接收到信息检索请求时后,服务器先查询了历史的检索记录,为了避免相同检索信息的重复检索,提高了信息的检索效率。

此外,参照图3,本发明实施例还提出一种基于搜索引擎的信息检索装置,所述基于搜索引擎的信息检索装置包括:

请求接收模块10,用于在接收到信息检索请求时,获取所述信息检索请求对应的检索信息和账户标识;

算法配置模块20,用于根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法;

信息检索模块30,用于根据所述检索信息和所述目标检索算法进行信息检索,得到与所述检索信息匹配的第一检索结果;

结果发送模块40,用于将所述第一检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看。

可选地,所述算法配置模块20,包括:

查询单元,用于获取所述检索信息的信息类型,查询预设算法推荐表,获取所述信息类型对应的第一检索算法;

获取单元,用于获取所述账户标识对应的各预设检索算法的历史评分,并将历史评分最高的预设检索算法作为第二检索算法;

确定单元,用于在所述第一检索算法和所述第二检索算法不同时,将所述第一检索算法和第二检索算法中优先级高的作为所述信息检索请求对应的目标检索算法。

可选地,所述的基于搜索引擎的信息检索装置,包括:

行为数据获取模块,用于接收所述终端发送的基于所述第一检索结果的用户行为数据,其中,所述用户行为数据包括:浏览时间和浏览频率;

命中信息确定模块,用于获取所述用户行为数据包含的对所述第一检索结果中各检索条目的浏览时间、浏览频率,将浏览时间最长或浏览频率最高的检索条目作为真实命中信息;

第二检索模块,用于按除所述目标检索算法之外的预设检索算法进行信息检索,得到与所述检索信息匹配的第二检索结果;

评分更新模块,用于根据所述真实命中信息、所述第一检索结果和所述第二检索结果,更新各预设检索算法的历史评分。

可选地,所述评分更新模块,包括:

排序获取单元,用于获取所述真实命中信息在所述第一检索结果和所述第二检索结果中的排序,获取排序最先的目标检索结果;

调整更新单元,用于调整所述目标检索结果对应的检索算法的评分,以完成历史评分的更新。

可选地,所述的基于搜索引擎的信息检索装置,包括:

数量判断模块,用于在所述目标检索算法配置完成之后,判断是否存在至少两个预设数据库;

数据库确定模块,用于若存在至少两个预设数据库,则获取各个预设数据库的访问频率,将所述访问频率最高的预设数据库作为信息检索请求对应的目标数据库。

可选地,所述信息检索模块30,包括:

分词处理单元,用于将所述检索信息按所述目标检索算法中的分词算法进行分词处理,得到所述检索信息对应的关键词集合;

查询匹配单元,用于查询所述目标数据库,按所述目标检索算法中的相似度算法,获取与所述关键词集合匹配的检索条目,并排列各所述检索条目得到第一检索结果。

可选地,所述的基于搜索引擎的信息检索装置,包括:

历史查询模块,用于获取所述账户标识的历史检索记录,将所述历史检索记录中的各历史检索结果与所述检索信息进行比较,判断所述历史检索记录中是否存在与所述检索信息匹配的历史检索结果;

历史输出模块,用于在存在与所述检索信息匹配的历史检索结果时,将所述历史检索结果发送至所述账户标识对应的终端,以供所述终端对应用户查看;

在不存在与所述检索信息匹配的历史检索结果时,执行算法配置模块20的步骤:根据所述检索信息和所述账户标识,配置所述信息检索请求对应的目标检索算法。

其中,基于搜索引擎的信息检索装置的各个功能模块实现的步骤可参照本发明基于搜索引擎的信息检索方法的各个实施例,此处不再赘述。

此外,本发明实施例还提出一种计算机存储介质。

所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的基于搜索引擎的信息检索方法中的操作。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1