信息检索方法、装置、存储介质及计算机设备与流程

文档序号:17927105发布日期:2019-06-15 00:29阅读:107来源:国知局
信息检索方法、装置、存储介质及计算机设备与流程

本申请涉及检索技术领域,具体而言,本申请涉及一种信息检索方法、装置、存储介质及计算机设备。



背景技术:

用户在使用搜索引擎进行数据搜索时,在搜索引擎的检索框输入搜索关键词,搜索引擎在数据库中查找包含尽可能多的关键词的搜索结果,用户在所述搜索结果中选择目标搜索结果即可。但对于一些涉及事关国家安全的单位部门,如科研部门,若利用搜索引擎在广域数据库中进行检索,可以通过内部人员的检索信息反向推导出该单位部门的科研方向及进度,导致机密信息泄露,为了避免这种情况的出现,这些具有保密需要的单位往往倾向于在局域网范围内进行检索,但科技的进步日新月异,局域网提供的检索结果并不全面,无法满足用户需要。



技术实现要素:

本申请提供了一种信息检索方法、信息检索装置、计算机可读存储介质及计算机设备,以提高检索信息的安全性,避免由于调用外部检索引擎导致的信息泄露问题。

本申请实施例首先提供了一种信息检索方法,包括:获取用户输入的第一检索信息,将所述第一检索信息与混淆信息进行加密运算,得到第二检索信息;

调用第三方搜索引擎检索所述第二检索信息获得第二检索结果,并将所述第二检索结果缓存至本地数据库中;

根据所述第一检索信息在所述本地数据库的第二检索结果中进行二次检索,得到所述第一检索信息对应的第一检索结果。

在一种实施例中,所述将所述第二检索结果缓存至本地数据库中的步骤之后,还包括:

根据所述混淆信息在所述第二检索结果中进行检索,得到第三检索结果,根据所述第三检索结果对所述第二检索结果进行过滤。

在一种实施例中,所述将所述第一检索信息与混淆信息进行加密运算的步骤之前,还包括:

利用第一检索信息在本地数据库中进行检索,得到原始检索结果;

获得原始检索结果与第一检索信息的匹配度;

检测到所述原始检索结果中满足预设条件的检索结果的数量低于预设阈值,所述预设条件包括原始检索结果中与第一待检索信息的匹配度超过预设阈值。

在一种实施例中,所述获得原始检索结果与待检索信息的匹配度的步骤,包括:

解析所述第一检索信息获得检索关键词,根据语义识别获得各检索关键词的权重;

按照原始检索结果中包含的检索关键词获得原始检索结果与第一检索信息的匹配度。

在一种实施例中,所述将所述第一检索信息与混淆信息进行加密运算的步骤,包括:

获得所述第一检索信息的混淆信息;

根据预设的加密密钥对所述第一检索信息及其混淆信息进行加密运算。

在一种实施例中,所述得到所述第一检索信息对应的第一检索结果的步骤,包括:

获得第一检索结果与所述第一检索信息的匹配度;

按照所述匹配度对所述第一检索结果的匹配度进行排序,输出排序后的第一检索结果。

在一种实施例中,所述将所述第二检索结果缓存至本地数据库中的步骤之前,还包括:

获取所述本地数据库的属性信息,根据所述属性信息对所述第二检索结果进行过滤。

进一步地,本申请实施例还提供了一种信息检索装置,包括:

加密模块,用于获取用户输入的第一检索信息,将所述第一检索信息与混淆信息进行加密运算,得到第二检索信息;

缓存模块,用于调用第三方搜索引擎检索所述第二检索信息获得第二检索结果,并将所述第二检索结果缓存至本地数据库中;

二次检索模块,用于根据所述第一检索信息在所述本地数据库的第二检索结果中进行二次检索,得到所述第一检索信息对应的第一检索结果。

进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述任一项技术方案所述的信息检索方法的步骤。

更进一步地,本申请实施例还提供了一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一技术方案所述的信息检索方法的步骤。

与现有技术相比,本申请提供的方案至少具备如下优点:

本申请实施例提供的信息检索方法,通过对第一检索信息进行加密,利用加密后的第二检索信息获得第二检索结果,在第二检索结果中进行第一检索信息的二次检索,输出第一检索信息对应的第一检索结果。由于调用第三方搜索引擎进行检索时,已经对第一检索信息进行了加密,若要根据搜寻到的第二检索信息获得第一检索信息,在不知道加密密钥的情况下,几乎无法准确获得第一检索信息,提高了第一检索信息在第三方搜索引擎上搜索的安全性。

本申请实施例提供的信息检索方法,将根据加密后第二检索信息获得的第二检索结果全部缓存至本地数据库中,使得不法分子根据下载数据进行第一检索信息的反向推导的成功率大大降低,进一步提高了第一检索信息的安全性。在将第二检索结果存储于本地端之后,利用第一检索信息在第二检索结果中进行二次检索,由于第二检索结果的数据量与本地数据库中的数据量相比小,能够提高第一检索信息进行二次检索的效率。

本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请一个实施例提供的信息检索方法的实施环境图;

图2为本申请一个实施例提供的信息检索方法的流程示意图;

图3为本申请一个实施例提供的对第二检索结果进行过滤的流程示意图;

图4为本申请另一个实施例提供信息检索方法的流程示意图,其重点展示步骤s210中的将所述第一检索信息与混淆信息进行加密运算之前,在本地数据库中进行检索的步骤;

图5为本申请一个实施例提供的获得原始检索结果与第一检索信息的匹配度的流程示意图;

图6为本申请一种实施例提供的得到所述第一检索结果对应的第一检索结果的步骤的流程示意图;

图7为本申请一种实施例提供的计算机设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。

本领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一直播视频图像称为第二直播视频图像,且类似地,可将第二直播视频图像称为第一直播视频图像。第一直播视频图像和第二直播视频图像两者都是直播视频图像,但其不是同一个直播视频图像。

本领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。

如图1所示,图1为一个实施例中提供的信息检索方法的实施环境图,在该实施环境中,包括用户终端、服务器端以及第三方搜索引擎端。

本实施例中服务器端为本地搜索引擎,其接收用户终端输入的第一检索信息,将所述第一检索信息与混淆信息进行加密运算,得到第二检索信息;调用第三方搜索引擎检索所述第二检索信息获得第二检索结果,并将所述第二检索结果缓存至本地数据库中;根据所述第一检索信息在所述本地数据库的第二检索结果中进行二次检索,得到所述第一检索信息对应的第一检索结果。

需要说明的是,用户终端可为智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。服务器端以及第三方搜索引擎端可为计算机设备,服务器端与用户终端、计算机设备与第三方搜索引擎端可以通过蓝牙、usb(universalserialbus,通用串行总线)或者其他通讯连接方式进行连接,本申请在此不做限制。

在一个实施例中,图2为本申请实施例提供的信息检索方法的流程示意图,该信息检索方法可以应用于上述的计算机设备中,包括如下步骤:

步骤s210,获取用户输入的第一检索信息,将所述第一检索信息与混淆信息进行加密运算,得到第二检索信息;

步骤s220,调用第三方搜索引擎检索所述第二搜索信息获得第二检索结果,并将所述第二检索结果缓存至本地数据库中;

步骤s230,根据所述第一检索信息在所述本地数据库的第二检索结果中进行二次检索,得到所述第一检索信息对应的第一检索结果。

接收用户输入的第一检索信息,所述第一检索信息可以是检索关键词、段落等,根据预设混淆规则获得第一检索信息的混淆信息,对第一检索信息与混淆信息进行加密运算,如对若干检索关键词进行随机组合等方式加密,获得加密后的第二检索信息,该第二检索信息是对第一检索信息的加密结果,包含第一检索信息及大量的混淆信息,调用第三方搜索引擎对第二检索信息进行检索,获得对应的第二检索结果,第二检索结果中包含第一检索信息对应的检索结果,将第二检索结果缓存至本地数据库中,再从本地数据库中进行第一检索信息的检索,获得第一检索信息对应的第一检索结果,由于第二检索结果是针对加密检索信息进行检索的结果,无法直接根据第二检索结果获得第一检索信息,从而提高了第一检索信息的安全性。

本申请提供的方案中,通过对第一检索信息进行加密,利用加密后的第二检索信息获得第二检索结果,在第二检索结果中进行第一检索信息的二次检索,输出第一检索信息对应的第一检索结果。由于调用第三方搜索引擎进行检索时,已经对第一检索信息进行了加密,若要根据搜寻到的第二检索信息获得第一检索信息,在不知道加密密钥的情况下,几乎无法准确获得第一检索信息,提高了第一检索信息在第三方搜索引擎上搜索的安全性。将根据加密后第二检索信息获得的第二检索结果全部缓存至本地数据库中,使得不法分子根据下载数据进行第一检索信息的反向推导的成功率大大降低,进一步提高了第一检索信息的安全性。在将第二检索结果存储于本地端之后,利用第一检索信息在第二检索结果中进行二次检索,由于第二检索结果的数据量与本地数据库中的数据量相比小,则能够提高第一检索信息进行二次检索的效率。

为了更清楚本申请提供的信息检索方案及其技术效果,接下来以多个实施例对其具体方案进行详细阐述。

在步骤s220的将所述第二检索结果缓存至本地数据库中的步骤之后,还可以对第二检索结果进行过滤,以便进一步提高二次检索的效率,优选采用如图3所示的方式进行:

s310,根据混淆信息在所述第二检索结果中进行检索,得到第三检索结果;

s320,根据所述第三检索结果对所述第二检索结果进行过滤。

具体地,在步骤s310之前,还包括:获得加密运算对应的解密密钥,根据解密密钥进行解密运算,获得混淆信息。

本实施例提供的方案,利用混淆信息进行第二检索结果进行过滤,减少第二检索结果的数据量,进一步减少第一检索信息在第二检索结果中的检索时间,提高获得第一检索结果的检索效率。

一种实施例中,在步骤s220的将所述第二检索结果缓存至本地数据库中的步骤之前,还可以进行如下步骤:获取所述本地数据库的属性信息,根据所述属性信息对所述第二检索结果进行过滤。

所述信息过滤的目的优选过滤掉与所述本地数据库信息无关的信息,过滤操作可以根据本地数据库的属性信息进行,也可以调用过滤软件进行。如本地数据库中均是科研资料,属性信息为学术或科研,利用本实施例提供的方案能够过滤掉与科研或学术无关的检索结果,如与待检索信息无关的广告,保留纯净的检索结果,有利于进一步提高获得用户需求的目标检索结果的效率。

在一种实施例中,所述步骤s210中的将所述第一检索信息与混淆信息进行加密运算之前,还可以先在本地数据库中进行检索,本地数据库中的原始检索结果不满足用户需求之后,再进行步骤s210,其流程示意图如4所示,具体包括如下步骤:

s410,利用第一检索信息在本地数据库中进行检索,得到原始检索结果;

s420,获得原始检索结果与第一检索信息的匹配度;

s430,检测到所述原始检索结果中满足预设条件的检索结果的数量低于预设阈值,所述预设条件包括第一检索结果中与第一待检索信息的匹配度超过预设阈值。

本实施例提供的方案,在对第一检索信息进行加密,以便调用第三方搜索引擎检索之前,进行本地数据库的检索,若本地数据库中并未检索到符合预设条件的检索结果时,再进行步骤s210至步骤s230提供的方案,其中,预设条件是指原始检索结果中的检索结果与第一待检索信息的匹配度超过预设阈值。

本实施例还包括步骤s440,所述原始检索结果满足预设条件,返回原始检索结果至用户端。若本地数据库中检索得到的第一检索结果已经满足预设阈值,则将第一检索结果返回用户端,检索过程结束。

本申请实施例提供的方案,在进行第一检索信息进行加密之前,首先在本地数据库中进行检索,获得原始检索结果,基于原始检索结果与第一检索信息的匹配度进行判断是否进行二次检索,针对原始检索结果满足预设条件的第一检索信息,无需进行二次检索,降低检索过程的时间成本,快速返回检索结果,且该种情形下的第一检索信息被外部恶意获取到的概率微乎其微,进一步降低了第一检索信息泄露的风险。

本实施例中,步骤s420的获得原始检索结果与第一检索信息的匹配度的方式有多种,本申请实施例优选采用如下方式获得,其流程示意图如图5所示。

s4201,解析所述第一检索信息获得检索关键词,根据语义识别获得各检索关键词的权重;

s4202,按照原始检索结果中包含的检索关键词获得原始检索结果与第一检索信息的匹配度。

解析所述第一检索信息获得其语义信息,根据语义识别获得各检索关键词,对比所述原始检索结果与第一检索信息的语义信息,根据检索关键词与原始检索结果的重合度获得两者之间的匹配值。原始检索结果完全覆盖所述检索关键词,则原始检索结果与第一检索信息的匹配度为100%。

若第一检索信息为一段文字、图片或其组合,解析第一检索信息获得检索子信息,检索子信息可以是关键词,根据预设规则获得各检索子信息的权重,根据所述权重获得第一检索信息与原始检索结果的匹配值,如第一检索信息包括检索子信息a、b、c、d,其中a、b的权重分别为55%、20%,原始检索结果甲仅覆盖检索子信息a,原始检索结果乙仅覆盖检索子信息b,则可设置原始检索结果甲、乙与第一检索信息的匹配值分别为55%、20%。

本方案根据第一检索信息与原始检索结果的匹配值与预设阈值的大小,确定是否调用第三方搜索引擎对第二检索信息进行二次检索,保证检索过程及检索结果的安全性、流畅性,若匹配值符合需求,则无需进行调用第三方搜索引擎,降低系统能耗。

步骤s210的将所述第一检索信息与混淆信息进行加密运算,得到第二检索信息的步骤,可以采用如下方式获得:

a、获得所述第一检索信息的混淆信息;b、根据预设的加密密钥对所述第一检索信息及其混淆信息进行加密运算。

其中,第一检索信息的混淆信息可以采用如下方式获得:获取第一待检索信息的同义词、反义词、近义词等;对所述同义词、反义词、近义词进行随机组合,获得第一检索信息的混淆信息。

通过对第一检索信息进行加密,能够将第一检索信息隐藏于第二检索信息中,使得不法分子无法通过检索信息准确获知用户端输入的第一检索信息,提高第一检索信息的安全性。

步骤s230中得到所述第一检索结果对应的第一检索结果的步骤,可以通过如下方式进行,其流程示意图如图6所示。

s2301,获得第一检索结果与所述第一检索信息的匹配度;

s2302,按照所述匹配度对所述第一检索结果的匹配度进行排序,输出排序后的第一检索结果。

由于将第一检索结果输出到用户端时,用户会根据第一检索结果的顺序进行查看,若将与第一检索结果的匹配度最高的检索结果置于排序靠前的位置,则有利于用户降低获得目标检索结果的时间,提高获得目标检索结果的效率,因此本申请在将第一检索结果推送到用户端之前,还需要对第一检索结果进行排序。

本申请s2301的获得第一检索结果与第一检索信息的匹配度时,可以优选采用上述实施例提供的原始检索结果与第一检索信息之间匹配度的方式获得,根据第一检索信息的检索子信息,如检索关键词,与第一检索结果之间的关系获得第一检索结果与第一检索信息之间的匹配度,按照匹配度由高到低的顺序排列,按照排序后的第一检索结果输出到用户端。

本申请实施例提供的对第一检索结果进行排序后输出的方式,有利于用户端快速准确地获得目标检索结果,降低用户端获得目标检索结果的时间,避免由于用户需求的目标检索结果排序靠后导致的重新检索,有利于降低系统能耗。

以上为本申请提供的信息检索方法的实施例,针对于该方法,本申请实施例还对应提供了一种信息检索装置,下面阐述信息检索装置的实施例。

本申请实施例还提供了一种信息检索装置,包括加密模块、缓存模块、二次检索模块,具体配置信息如下:

加密模块,用于获取用户输入的第一检索信息,将所述第一检索信息与混淆信息进行加密运算,得到第二检索信息;

缓存模块,用于调用第三方搜索引擎检索所述第二检索信息获得第二检索结果,并将所述第二检索结果缓存至本地数据库中;

二次检索模块,用于根据所述第一检索信息在所述本地数据库的第二检索结果中进行二次检索,得到所述第一检索信息对应的第一检索结果。

关于上述实施例中的信息检索装置,其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

进一步地,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现上述任意一项所述的信息检索方法。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、cd-rom、和磁光盘)、rom(read-onlymemory,只读存储器)、ram(randomaccessmemory,随即存储器)、eprom(erasableprogrammableread-onlymemory,可擦写可编程只读存储器)、eeprom(electricallyerasableprogrammableread-onlymemory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。

更进一步地,本申请实施例还提供一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的信息检索方法。

图7是根据一示例性实施例示出的一种用于计算机设备700的框图。例如,计算机设备700可以被提供为一服务器。参照图7,计算机设备700包括处理组件722,其进一步包括一个或多个处理器,以及由存储器732所代表的存储器资源,用于存储可由处理组件722的执行的指令,例如应用程序。存储器732中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件722被配置为执行指令,以执行上述信息检索方法的步骤。

计算机设备700还可以包括一个电源组件726被配置为执行计算机设备700的电源管理,一个有线或无线网络接口750被配置为将计算机设备700连接到网络,和一个输入输出(i/o)接口758。计算机设备700可以操作基于存储在存储器732的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

应该理解的是,在本申请各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1