1.一种企业名称的相似性检索方法,其特征在于,包括:
对输入的检索关键字进行分解处理,得到处理后的检索关键字,其中,所述检索关键字为待检索的企业名称;
根据处理后的所述检索关键字,确定检索词组;
对确定的所述检索词组进行相似性检索,得到检索结果;
显示所述检索结果中排在前N位的企业名称,以供用户查看,N取大于1整数。
2.根据权利要求1所述的企业名称的相似性检索方法,其特征在于,所述对输入的检索关键字进行分段处理,得到处理后的检索关键字,包括:
判断所述检索关键字中是否包含行政区划和组织形式企业类型的组成部分;
若不包含,则将所述检索关键字分解为企业字号和/或行业特点以作为处理后的检索关键字;
否则,将所述检索关键字分解为行政区划、组织形式企业类型、企业字号和行业特点,并将企业字号和/或行业特点作为处理后的检索关键字。
3.根据权利要求1所述的企业名称的相似性检索方法,其特征在于,所述根据处理后的所述检索关键字,确定检索词组,包括:
将处理后的所述检索关键字按照分解处理之前的顺序排列;
将与所述检索关键字中M个字不同的词组确定为所述检索词组,M取0、1或2;或者,
将与所述检索关键字同义和/或同音的词组确定为所述检索词组;或者,
将与所述检索关键字中K个相同且相邻的字组成的词组确定为所述检索词组;或者,
将与所述检索关键字中Q个相同但分散的字组成的词组确定为所述检索词组。
4.根据权利要求1所述的企业名称的相似性检索方法,其特征在于,所述对确定的所述检索词组进行相似性检索,得到检索结果,包括:
判断所述检索词组的数量是否超过预设值;
若超过,则采用分布式多节点检索,并将每个节点得到的检索结果进行汇总,得到所述检索结果;
否则,采用单节点检索,得到所述检索结果。
5.根据权利要求1-4中任一项所述的企业名称的相似性检索方法,其特征在于,得到检索结果之后,还包括:
计算所述检索关键字与所述检索结果中的每个检索结果的相似度值;
根据所述相似度值,对所述检索结果进行排序。
6.根据权利要求5所述的企业名称的相似性检索方法,其特征在于,所述根据所述相似度值,对所述检索结果进行排序,包括:
根据所述相似度值由高到低,对所述检索结果进行排序。
7.根据权利要求5所述的企业名称的相似性检索方法,其特征在于,在对输入的检索关键字进行分段处理,得到处理后的检索关键字之前,还包括:构建企业名称检索库。
8.根据权利要求7所述的企业名称的相似性检索方法,其特征在于,所述构建企业名称检索库,包括:
将企业名称数据增加至全文检索数据库中,并保持实时同步;
建立所述企业名称数据与所述全文检索数据库的索引。
9.根据权利要求8所述的企业名称的相似性检索方法,其特征在于,所述建立所述企业名称数据与所述全文检索数据库的索引,包括:
将所述企业名称数据对应的每个企业名称包含的企业字号和行业特点作为索引列,建立所述企业名称数据与所述全文检索数据库的索引。
10.根据权利要求1所述的企业名称的相似性检索方法,其特征在于,所述显示所述检索结果中排在前N位的企业名称,以供用户查看,包括:
显示所述检索结果中排在前10位的企业名称,以供用户查看。