基于数字序列的数据检索方法、装置及设备与流程

文档序号:32392746发布日期:2022-11-30 08:58阅读:来源:国知局

技术特征:
1.一种基于数字序列的数据检索方法,其特征在于,包括:接收待检索数据请求,所述待检索数据请求中携带有待检索数据信息和词条拆解原则,其中,所述词条拆解原则包括结构式数据拆解原则和非结构式数据拆解原则;根据所述词条拆解原则,对所述待检索数据请求中的待检索信息进行词条拆解,并对词条拆解后的待检索信息中的词条进行检索式重排,得到预用检索式集合;对所述预用检索式集合中的各预用检索式的词性分类,并计算每一分类后的预用检索式相对该分类中其他预用检索式的皮尔逊相关系数,并计算各所述皮尔逊相关系数的平均值和方差;基于高斯定理,根据各所述皮尔逊相关系数的平均值、方差、各所述皮尔逊相关系数,对每一分类中的预用检索式进行相似性判断,并根据相似性判断结果对每一分类中的预用检索式进行去重处理;根据去重处理后的每一分类预用检索式进行编码,得到每一预用检索式对应的数字序列,根据所述每一预用检索式对应的数字序列,确定查询起始点、查询半径值和查询步进步数;以所述查询起始点为圆心、且以所述查询步进步数为目标步进步数逐步在所述查询半径值为半径的圆形区域内进行数据检索,得到所述待检索数据信息对应的检索结果,并输出用于响应所述待检索数据请求的检索结果。2.根据权利要求1所述的方法,其特征在于,所述以所述查询起始点为圆心、且以所述查询步进步数为目标步进步数逐步在所述查询半径值为半径的圆形区域内进行数据检索,得到所述待检索数据信息对应的检索结果,并输出用于响应所述待检索数据请求的检索结果的步骤,包括:以所述查询起始点为圆心,以初始查询半径为半径在所述查询半径值为半径的圆形区域内进行数据检索;对所述初始查询半径执行加查询步进的操作,并根据执行加查询步进操作后的初始查询半径,在所述查询半径值为半径的圆形区域内进行数据检索;循环执行所述对所述初始查询半径执行加查询步进的操作,到所述在所述查询半径值为半径的圆形区域内进行数据检索,直到加查询步进的次数达到所述查询步进步数。3.根据权利要求2所述的方法,其特征在于,所述输出用于响应所述待检索数据请求的检索结果,包括:逐次将所述初始查询半径为半径对应的检索结果进行展示,并将执行加查询步进操作后的初始查询半径对应的检索结果进行展示。4.根据权利要求1所述的方法,其特征在于,所述待检索数据请求包括地理范围条件,所述根据所述每一预用检索式对应的数字序列,确定查询起始点、查询半径值和查询步进步数的步骤,包括:通过数据接口将所述地理范围条件注入检索系统,从海量数据集中确定满足所述地理范围条件的查询半径值;确定各所述预用检索式对应的数字序列中每一数字出现的频率,并将频率最大的序列所在的存储位置作为所述查询起始点;确定各所述去重处理后的每一分类的数字序列中不同词性词条的数量,并将所述不同
词性词条的数量的数值作为所述查询步进步数。5.根据权利要求1所述的方法,其特征在于,所述根据去重处理后的每一分类预用检索式进行编码,得到每一预用检索式对应的数字序列的步骤,包括:给定最小信息单元,对最小信息单元进行编码,编码的结果为该信息单元的特征序列;对所述最小信息单元进行增量编码,其中,所述编码的方式为:信息序列按最小单元排列如下:i1、i2、i3、...、i
n
;依次表示为最小单元1到最小单元n的排列,其中,i1的特征序列定义为:t1=hash(n*i1),i2的特征序列定义为:t2=hash[(n-1)*t1+i2],依此类推,i
n
的特征序列定义为:t
n
=hash(t
n-1
+i
n
)。6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述根据所述词条拆解原则,对所述待检索数据请求中的待检索信息进行词条拆解的步骤,包括:在所述待检索数据信息为结构式数据的情况下,按照8位字节对所述待检索数据请求中的待检索信息进行词条拆解,所述结构式数据拆解原则为所述按照8位字节进行拆解;在所述待检索数据信息为非结构式数据的情况下,对所述待检索数据信息进行逐字节滑动的异或计算,并根据异或计算结果对所述待检索数据请求中的待检索信息进行词条拆解,所述非结构式数据拆解原则为逐字节滑动的异或计算。7.一种基于数字序列的数据检索装置,其特征在于,所述装置包括:接收模块,被配置为用于接收待检索数据请求,所述待检索数据请求中携带有待检索数据信息和词条拆解原则,其中,所述词条拆解原则包括结构式数据拆解原则和非结构式数据拆解原则;拆解模块,被配置为用于根据所述词条拆解原则,对所述待检索数据请求中的待检索信息进行词条拆解,并对词条拆解后的待检索信息中的词条进行检索式重排,得到预用检索式集合;分类模块,被配置为用于对所述预用检索式集合中的各预用检索式的词性分类,并计算每一分类后的预用检索式相对该分类中其他预用检索式的皮尔逊相关系数,并计算各所述皮尔逊相关系数的平均值和方差;去重模块,被配置为用于基于高斯定理,根据各所述皮尔逊相关系数的平均值、方差、各所述皮尔逊相关系数,对每一分类中的预用检索式进行相似性判断,并根据相似性判断结果对每一分类中的预用检索式进行去重处理;确定模块,被配置为用于根据去重处理后的每一分类预用检索式进行编码,得到每一预用检索式对应的数字序列,根据所述每一预用检索式对应的数字序列,确定查询起始点、查询半径值和查询步进步数;检索模块,被配置为用于以所述查询起始点为圆心、且以所述查询步进步数为目标步进步数逐步在所述查询半径值为半径的圆形区域内进行数据检索,得到所述待检索数据信息对应的检索结果,并输出用于响应所述待检索数据请求的检索结果。8.根据权利要求7所述的装置,其特征在于,所述检索模块,被配置为用于:以所述查询起始点为圆心,以初始查询半径为半径在所述查询半径值为半径的圆形区域内进行数据检索;对所述初始查询半径执行加查询步进的操作,并根据执行加查询步进操作后的初始查询半径,在所述查询半径值为半径的圆形区域内进行数据检索;
循环执行所述对所述初始查询半径执行加查询步进的操作,到所述在所述查询半径值为半径的圆形区域内进行数据检索,直到加查询步进的次数达到所述查询步进步数。9.根据权利要求8所述的装置,其特征在于,所述检索模块,被配置为用于:逐次将所述初始查询半径为半径对应的检索结果进行展示,并将执行加查询步进操作后的初始查询半径对应的检索结果进行展示。10.一种电子设备,其特征在于,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-6中任意一项所述基于数字序列的数据检索方法的步骤。

技术总结
本公开涉及一种基于数字序列的数据检索方法、装置及设备。包括:根据词条拆解原则对待检索信息进行词条拆解,对词条拆解后的待检索信息中的词条进行检索式重排得到预用检索式集合;对预用检索式的词性分类,计算各分类中预用检索式相对该分类中其他预用检索式的皮尔逊相关系数;基于高斯定理,根据各皮尔逊相关系数的平均值、方差、皮尔逊相关系数,对预用检索式进行相似性判断,根据相似性判断结果对预用检索式进行去重处理;根据去重处理后的预用检索式进行编码,得到对应的数字序列,根据数字序列,确定查询起始点、查询半径值和查询步进步数;根据查询起始点、查询步进步数和查询半径值进行数据检索,得到待检索数据信息对应的检索结果。应的检索结果。应的检索结果。


技术研发人员:宋华
受保护的技术使用者:深圳市创富金科技有限公司
技术研发日:2022.09.02
技术公布日:2022/11/29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1