搜索引擎的数据更新方法、装置、设备以及存储介质与流程

文档序号:28746318发布日期:2022-02-07 23:26阅读:来源:国知局

技术特征:
1.一种搜索引擎的数据更新方法,其特征在于,包括:获取第一搜索引擎中多条未匹配对应正确文本内容的第一查询语句;计算各个所述第一查询语句与第二搜索引擎的相关值;其中,所述第一搜索引擎与所述第二搜索引擎的类别不同;将多个所述第一查询语句的相关值相加,得到所述第二搜索引擎的相关总和;其中,所述第二搜索引擎包括多个;根据相关总和的数值从各个所述第二搜索引擎中选取第三搜索引擎;提取所述第三搜索引擎的数据源;获取所述数据源中的第二查询语句以及各所述第二查询语句对应的第一文本内容;将所述第二查询语句以及各所述第二查询语句对应的第一文本内容更新至所述第一搜索引擎的系统数据源中。2.如权利要求1所述的搜索引擎的数据更新方法,其特征在于,所述将所述第二查询语句以及各所述第二查询语句对应的第一文本内容更新至所述第一搜索引擎的系统数据源中的步骤,包括:获取所述第一搜索引擎中的第三查询语句以及所述第三查询语句对应的第二文本内容;提取各个所述第三查询语句与各个所述第二查询语句中相同的相同查询语句;通过flink流识别所述相同查询语句与所述第一文本内容的第一匹配度,以及与所述第二文本内容的第二匹配度;判断所述第二匹配度是否大于第一匹配度;若是,则在所述系统数据源中将所述第二文本内容替换所述第一文本内容。3.如权利要求2所述的搜索引擎的数据更新方法,其特征在于,所述获取所述第一搜索引擎中的第三查询语句以及所述第三查询语句对应的第二文本内容的步骤之后,还包括:提取所述第二查询语句中与各个所述第三查询语句查询内容都不同的不同查询语句作为目标查询语句;将所述目标查询语句、与所述目标查询语句对应的所述第一文本添加在所述第一搜索引擎的所述系统数据源中。4.如权利要求1所述的搜索引擎的数据更新方法,其特征在于,所述将所述第二查询语句以及各所述第二查询语句对应的第一文本内容更新至所述第一搜索引擎中的步骤之前,还包括:获取所述第一搜索引擎中的第三查询语句以及对应的第二文本内容;获取所述第一文本内容的第一维度信息,以及所述第二文本内容所对应的第二维度信息;其中,所述第一维度信息和所述第二维度信息分别包括多个维度;比较所述第一维度信息和所述第二维度信息,得到所述第一文本内容中所不具备的目标维度;基于所述目标维度从对应的所述第三搜索引擎中获取对应所述目标维度的维度内容;将所述维度内容添加至所述第一文本内容中。5.如权利要求1所述的搜索引擎的数据更新方法,其特征在于,所述计算各个所述第一查询语句与第二搜索引擎的相关值的步骤,包括:
获取所述第二搜索引擎的属性信息;将各个所述第一查询语句和所述属性信息分别进行向量化,得到各个所述第一查询语句对应的语句向量x
i
=(x
1i
,x
2i
,x
3i

x
ni
),以及所述属性信息分别对应的属性向量y
j
=(y
1j
,y
2j
,y
3j

y
nj
);其中,x
i
表示第i个第一查询语句对应的语句向量,表示y
j
表示第j个第二搜索引擎对应的属性向量;根据公式:计算得到所述相关值;其中,sim
ij
表示第i个第一查询语句与第j个所述第二搜索引擎的相关值。6.如权利要求1所述的搜索引擎的数据更新方法,其特征在于,所述根据相关总和的数值从各个所述第二搜索引擎中选取第三搜索引擎的步骤,包括:从所述第二搜索引擎中提取所述相关总和大于相关阈值的第三搜索引擎;获取各个所述第三搜索引擎的属性信息;通过预设的相似度算法计算各个所述第三搜索引擎任意两个之间的相似度;判断是否具有相似度大于相似度阈值的相似引擎组合;若有,则根据预设的筛选方法将所述相似引擎组合中的搜索引擎记为相似搜索引擎;将各个所述第三搜索引擎中除所述相似搜索引擎以外的搜索引擎记为第三搜索引擎。7.如权利要求1所述的搜索引擎的数据更新方法,其特征在于,所述将所述第二查询语句以及各所述第二查询语句对应的第一文本内容更新至所述第一搜索引擎的系统数据源中的步骤,包括:获取所述第一搜索引擎中的第三查询语句以及对应的第二文本内容;提取各个所述第三查询语句与各个所述第二查询语句中相同的相同查询语句;通过flink流识别所述相同查询语句对应的所述第一文本内容以及第二文本内容,并获取所述第一文本内容的第一时间戳,以及所述第二文本内容的第二时间戳;判断所述第二时间戳是否在所述第一时间戳之后;若是,则在所述系统数据源中将所述第二文本内容替换所述第一文本内容。8.一种搜索引擎的数据更新装置,其特征在于,包括:第一获取模块,用于获取第一搜索引擎中多条未匹配对应正确文本内容的第一查询语句;第一计算模块,用于计算各个所述第一查询语句与第二搜索引擎的相关值;其中,所述第一搜索引擎与所述第二搜索引擎的类别不同;第二计算模块,用于将多个所述第一查询语句的相关值相加,得到所述第二搜索引擎的相关总和;其中,所述第二搜索引擎包括多个;选取模块,用于根据相关总和的数值从各个所述第二搜索引擎中选取第三搜索引擎;提取模块,用于提取所述第三搜索引擎的数据源;第二获取模块,用于获取所述数据源中的第二查询语句以及各所述第二查询语句对应的第一文本内容;更新模块,用于将所述第二查询语句以及各所述第二查询语句对应的第一文本内容更
新至所述第一搜索引擎的系统数据源中。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

技术总结
本申请提供了一种搜索引擎的数据更新方法、装置、设备以及存储介质,其中,方法包括:通过获取第一搜索引擎中的第一查询语句,并计算与第二搜索引擎的相关值,从各个所述第二搜索引擎中选取第三搜索引擎,获取所述数据源中的第二查询语句以及各所述第二查询语句对应的第一文本内容,并更新至所述第一搜索引擎的系统数据源中。本申请的有益效果:通过获取到第二搜索引擎的数据源对系统数据源进行更新,从而丰富了第一搜索引擎的系统数据源中的文本内容,有效减少了用户在检索过程中出现查询结果存在偏差的可能性。果存在偏差的可能性。果存在偏差的可能性。


技术研发人员:陆园丽
受保护的技术使用者:平安国际智慧城市科技股份有限公司
技术研发日:2021.10.29
技术公布日:2022/2/6
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1