非结构化数据全文搜索方法、系统及计算机设备与流程

文档序号:24352503发布日期:2021-03-19 12:38阅读:来源:国知局

技术特征:

1.一种非结构化数据全文搜索方法,其特征在于,所述方法包括:

将非结构化文件解析成半结构化信息;

对所述半结构化信息和全文搜索的关键信息进行向量化处理,得到向量化结果;

根据所述向量化结果进行召回处理,确定目标全文搜索结果。

2.根据权利要求1所述的方法,其特征在于,所述向量结果包括向量化单元信息以及向量化关键信息;

所述对所述半结构化信息和全文搜索的关键信息进行向量化处理,得到向量化结果,包括:

对所述半结构化信息进行向量化处理,得到所述向量化单元信息;

对所述全文搜索的关键信息进行向量化处理,得到所述向量化关键信息。

3.根据权利要求2所述的方法,其特征在于,所述对所述半结构化信息进行向量化处理,得到向量化单元信息,包括:

提取所述半结构化信息中的不同单元信息;

对不同单元信息进行向量化处理,得到所述向量化单元信息。

4.根据权利要求3所述的方法,其特征在于,所述根据不同单元信息进行向量化处理,得到所述向量化单元信息,包括:

对不同单元信息进行预处理,得到预处理后的不同单元信息;

对所述预处理后的不同单元信息进行向量化处理,得到所述向量化单元信息。

5.根据权利要求2-4中任一项所述的方法,其特征在于,所述方法还包括:

接收全文搜索指令,其中,所述全文搜索指令包括全文搜索的关键信息;

响应所述全文搜索指令。

6.根据权利要求1所述的方法,其特征在于,所述根据所述向量化结果进行召回处理,确定目标全文搜索结果,包括:

对所述向量化单元信息和所述向量化关键信息进行相似度处理,得到初始全文搜索结果;

对所述初始全文搜索结果进行排序处理,确定目标全文搜索结果。

7.根据权利要求6所述的方法,其特征在于,所述对所述初始全文搜索结果进行排序处理,确定目标全文搜索结果,包括:

根据目标搜索信息,对所述初始全文搜索结果进行排序处理,获取所述目标全文搜索结果。

8.根据权利要求5所述的方法,其特征在于,所述方法还包括:将所述向量化单元信息存储至全文搜索引擎。

9.一种非结构化数据全文搜索系统,其特征在于,所述系统包括:

文件解析模块,用于将非结构化文件解析成半结构化信息;

向量化模块,用于对所述半结构化信息和全文搜索的关键信息进行向量化处理,得到向量化结果;

召回模块,用于根据所述向量化结果进行召回处理,确定目标全文搜索结果。

10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。


技术总结
本申请涉及一种非结构化数据全文搜索方法、系统及计算机设备。该方法包括:将非结构化文件解析成半结构化信息,对半结构化信息和全文搜索的关键信息进行向量化处理,得到向量化结果,并根据向量化结果进行召回处理,确定目标全文搜索结果;该方法不需要打开非结构化文件,也不需要将非结构化文件转换成结构化文件后,执行先获取预期搜索的目标文本信息对应的索引信息,再根据索引信息从非结构化文件中提取目标文本信息这样复杂的流程,可以将非结构化文件解析为半结构化文件后,进一步实现智能搜索直接获取,从而降低了非结构化数据全文搜索方法操作的复杂性,提高了非结构化数据的搜索效率。

技术研发人员:高静;谢国栋;庄之中
受保护的技术使用者:武汉联影医疗科技有限公司
技术研发日:2020.12.03
技术公布日:2021.03.19
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1