本申请涉及数据处理,尤其涉及一种数据搜索方法、装置、计算机设备及存储介质。
背景技术:
1、随着计算机技术的发展,在数据搜索场景中出现越来越多的文本长度较长且搜索量较小但覆盖面较广的搜索数据。然而,目前针对文本长度较长且搜索量较小但覆盖面较广的搜索数据的搜索技术有所欠缺,文本长度较长且搜索量较小但覆盖面较广的搜索数据较难被搜索引擎准确匹配,针对文本长度较长且搜索量较小但覆盖面较广的搜索数据的搜索效果较差。因此,如何提高文本长度较长且搜索量较小但覆盖面较广的搜索数据的搜索效果成了重要问题。
技术实现思路
1、本申请实施例提供了一种数据搜索方法、装置、计算机设备及存储介质,可以提高数据搜索的准确性。
2、第一方面,本申请实施例提供了一种数据搜索方法,包括:
3、获取待处理文本数据集,所述待处理文本数据集包括多个待处理文本数据,每个待处理文本数据包括多个待处理搜索词;
4、将所述每个待处理文本数据对应的各个待处理搜索词输入预训练的数据生成模型,得到与所述各个待处理搜索词对应的多个预测搜索词;
5、计算各个待处理搜索词与各个预测搜索词之间的相似度,根据所述各个待处理搜索词与各个预测搜索词之间的相似度建立所述各个待处理搜索词与各个预测搜索词之间的关系数据库;
6、获取待搜索词,并根据所述关系数据库确定与所述待搜索词对应的目标搜索词,利用所述目标搜索词搜索得到与所述搜索词对应的搜索结果数据。
7、第二方面,本申请实施例提供了一种数据搜索装置,包括:
8、获取单元,用于获取待处理文本数据集,所述待处理文本数据集包括多个待处理文本数据,每个待处理文本数据包括多个待处理搜索词;
9、预测单元,用于将所述每个待处理文本数据对应的各个待处理搜索词输入预训练的数据生成模型,得到与所述各个待处理搜索词对应的多个预测搜索词;
10、构建单元,用于计算各个待处理搜索词与各个预测搜索词之间的相似度,根据所述各个待处理搜索词与各个预测搜索词之间的相似度建立所述各个待处理搜索词与各个预测搜索词之间的关系数据库;
11、搜索单元,用于获取待搜索词,并根据所述关系数据库确定与所述待搜索词对应的目标搜索词,利用所述目标搜索词搜索得到与所述搜索词对应的搜索结果数据。
12、第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述处理器用于执行上述第一方面所述的方法。
13、第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有程序指令,该程序指令被执行时实现上述第一方面所述的方法。
14、本申请实施例可以获取待处理文本数据集,该待处理文本数据集包括多个待处理文本数据,每个待处理文本数据包括多个待处理搜索词;将每个待处理文本数据对应的各个待处理搜索词输入预训练的数据生成模型,得到与各个待处理搜索词对应的多个预测搜索词;计算各个待处理搜索词与各个预测搜索词之间的相似度,根据各个待处理搜索词与各个预测搜索词之间的相似度建立各个待处理搜索词与各个预测搜索词之间的关系数据库;获取待搜索词,并根据关系数据库确定与待搜索词对应的目标搜索词,利用目标搜索词搜索得到与搜索词对应的搜索结果数据,有助于提高数据搜索的准确性。
1.一种数据搜索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述每个待处理文本数据对应的各个待处理搜索词输入预训练的数据生成模型之前,还包括:
3.根据权利要求1所述的方法,其特征在于,所述将所述每个待处理文本数据对应的各个待处理搜索词输入预训练的数据生成模型,得到与所述各个待处理搜索词对应的多个预测搜索词之前,还包括:
4.根据权利要求1所述的方法,其特征在于,所述计算各个待处理搜索词与各个预测搜索词之间的相似度,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据对比结果对所述预设的神经网络模型进行训练,得到相似度判别模型,包括:
6.根据权利要求1所述的方法,其特征在于,
7.根据权利要求1所述的方法,其特征在于,所述将所述每个待处理文本数据对应的各个待处理搜索词输入预训练的数据生成模型,得到与所述各个待处理搜索词对应的多个预测搜索词,包括:
8.一种数据搜索装置,其特征在于,包括:
9.一种计算机设备,其特征在于,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,该程序指令被执行时实现如权利要求1-7任一项所述的方法。