1.一种非结构化数据全文搜索方法,其特征在于,所述方法包括:
将非结构化文件解析成半结构化信息;
对所述半结构化信息和全文搜索的关键信息进行向量化处理,得到向量化结果;
根据所述向量化结果进行召回处理,确定目标全文搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述向量结果包括向量化单元信息以及向量化关键信息;
所述对所述半结构化信息和全文搜索的关键信息进行向量化处理,得到向量化结果,包括:
对所述半结构化信息进行向量化处理,得到所述向量化单元信息;
对所述全文搜索的关键信息进行向量化处理,得到所述向量化关键信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述半结构化信息进行向量化处理,得到向量化单元信息,包括:
提取所述半结构化信息中的不同单元信息;
对不同单元信息进行向量化处理,得到所述向量化单元信息。
4.根据权利要求3所述的方法,其特征在于,所述根据不同单元信息进行向量化处理,得到所述向量化单元信息,包括:
对不同单元信息进行预处理,得到预处理后的不同单元信息;
对所述预处理后的不同单元信息进行向量化处理,得到所述向量化单元信息。
5.根据权利要求2-4中任一项所述的方法,其特征在于,所述方法还包括:
接收全文搜索指令,其中,所述全文搜索指令包括全文搜索的关键信息;
响应所述全文搜索指令。
6.根据权利要求1所述的方法,其特征在于,所述根据所述向量化结果进行召回处理,确定目标全文搜索结果,包括:
对所述向量化单元信息和所述向量化关键信息进行相似度处理,得到初始全文搜索结果;
对所述初始全文搜索结果进行排序处理,确定目标全文搜索结果。
7.根据权利要求6所述的方法,其特征在于,所述对所述初始全文搜索结果进行排序处理,确定目标全文搜索结果,包括:
根据目标搜索信息,对所述初始全文搜索结果进行排序处理,获取所述目标全文搜索结果。
8.根据权利要求5所述的方法,其特征在于,所述方法还包括:将所述向量化单元信息存储至全文搜索引擎。
9.一种非结构化数据全文搜索系统,其特征在于,所述系统包括:
文件解析模块,用于将非结构化文件解析成半结构化信息;
向量化模块,用于对所述半结构化信息和全文搜索的关键信息进行向量化处理,得到向量化结果;
召回模块,用于根据所述向量化结果进行召回处理,确定目标全文搜索结果。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。