填充有序序列的方法和装置与流程

文档序号:19189086发布日期:2019-11-20 01:52阅读:来源:国知局

技术特征:

1.一种填充有序序列的方法,其特征在于,包括:

确定待填充有序序列与各个参考序列的相似度;

根据所述相似度,从所述多个参考序列中筛选目标参考序列;

根据所述目标参考序列,对待填充有序序列的缺失处进行填充;

其中,参考序列是指与待填充有序序列类型相同或相似,且不存在缺失处的有序序列。

2.根据权利要求1所述的方法,其特征在于,对于每个参考序列,按照以下方法确定待填充有序序列与该参考序列的相似度:

截取待填充有序序列中包含缺失处的m段序列段;

确定该参考序列中与所述包含缺失处的m段序列段对应的参考序列段;

根据所述包含缺失处的m段序列段与参考序列段,确定待填充有序序列与该参考序列的相似度。

3.根据权利要求2所述的方法,其特征在于,根据所述包含缺失处的m段序列段与参考序列段,确定待填充有序序列与该参考序列的相似度,包括:

根据每段参考序列段的长度,确定每段参考序列段的权重;

根据每段参考序列段与对应的包含缺失处的序列段,确定每段参考序列段与对应的包含缺失处的序列段的相似度;

根据每段参考序列段的权重,确定该参考序列中每段参考序列段与对应的包含缺失处的序列段的相似度的加权平均值;

以所述加权平均值,作为待填充有序序列与该参考序列的相似度;

其中,长度短的参考序列段的权重大于长度长的参考序列段的权重。

4.根据权利要求1所述的方法,其特征在于,根据所述目标参考序列,对待填充有序序列的缺失处进行填充,包括:

确定各个目标参考序列中与待填充有序序列缺失处对应的数值的平均值;

根据所述平均值,对待填充有序序列的缺失处进行填充。

5.根据权利要求1所述的方法,其特征在于,根据所述目标参考序列,对待填充有序序列的缺失处进行填充,包括:

以每个目标参考序列对应的相似度作为对应目标参考序列的权重,确定所有目标参考序列中与待填充有序序列的缺失处对应的数值的加权平均值;

根据所述加权平均值,对待填充有序序列的缺失处进行填充;

其中,相似度高的目标参考序列中数值的权重大于相似度低的目标参考序列中数值的权重。

6.根据权利要求1所述的方法,其特征在于,确定待填充有序序列与各个参考序列的相似度之前,还包括:按照预设的映射方式对所述待填充有序序列与各个参考序列进行标准化处理;

根据所述目标参考序列,对待填充有序序列的缺失处进行填充之后,还包括:根据所述映射方式的逆映射,对填充后的序列进行反标准化处理。

7.根据权利要求6所述的方法,其特征在于,按照预设的映射方式对所述待填充有序序列与各个参考序列进行标准化处理,包括:

对所述待填充有序序列与各个参考序列进行正态化处理;和/或,

将待填充有序序列与各个参考序列中的数值映射到预设取值范围内。

8.根据权利要求1-7中之一所述的方法,其特征在于,确定待填充有序序列与各个参考序列的相似度之前,还包括:剔除待填充有序序列与各个参考序列中的异常值;

其中,所述异常值,包括:超出待填充有序序列或各个参考序列阈值的数值,和/或,不符合待填充有序序列或各个参考序列变化趋势的数值;其中,所述阈值是根据均值和/或标准差设置的。

9.一种填充有序序列的装置,其特征在于,包括:

相似度确定模块,用于确定待填充有序序列与各个参考序列的相似度;

参考序列筛选模块,用于根据所述相似度,从所述多个参考序列中筛选目标参考序列;

缺失处填充模块,用于根据所述目标参考序列,对待填充有序序列的缺失处进行填充;

其中,参考序列是指与待填充有序序列类型相同或相似,且不存在缺失处的有序序列。

10.根据权利要求9所述的装置,其特征在于,在所述相似度确定模块中,对于每个参考序列,按照以下方法确定待填充有序序列与该参考序列的相似度:

截取待填充有序序列中包含缺失处的m段序列段;

确定该参考序列中与所述包含缺失处的m段序列段对应的参考序列段;

根据所述包含缺失处的m段序列段与参考序列段,确定待填充有序序列与该参考序列的相似度。

11.根据权利要求10所述的装置,其特征在于,根据所述包含缺失处的m段序列段与参考序列段,确定待填充有序序列与该参考序列的相似度,包括:

根据每段参考序列段的长度,确定每段参考序列段的权重;

根据每段参考序列段与对应的包含缺失处的序列段,确定每段参考序列段与对应的包含缺失处的序列段的相似度;

根据每段参考序列段的权重,确定该参考序列中每段参考序列段与对应的包含缺失处的序列段的相似度的加权平均值;

以所述加权平均值,作为待填充有序序列与该参考序列的相似度;

其中,长度短的参考序列段的权重大于长度长的参考序列段的权重。

12.根据权利要求9所述的装置,其特征在于,所述缺失处填充模块根据所述目标参考序列,对待填充有序序列的缺失处进行填充,包括:

确定各个目标参考序列中与待填充有序序列缺失处对应的数值的平均值;

根据所述平均值,对待填充有序序列的缺失处进行填充。

13.根据权利要求9所述的装置,其特征在于,所述缺失处填充模块根据所述目标参考序列,对待填充有序序列的缺失处进行填充,包括:

以每个目标参考序列对应的相似度作为对应目标参考序列的权重,确定所有目标参考序列中与待填充有序序列的缺失处对应的数值的加权平均值;

根据所述加权平均值,对待填充有序序列的缺失处进行填充;

其中,相似度高的目标参考序列中数值的权重大于相似度低的目标参考序列中数值的权重。

14.根据权利要求9所述的装置,其特征在于,还包括标准化处理模块;

确定待填充有序序列与各个参考序列的相似度之前,所述标准化处理模块按照预设的映射方式对所述待填充有序序列与各个参考序列进行标准化处理;

根据所述目标参考序列,对待填充有序序列的缺失处进行填充之后,所述标准化处理模块根据所述映射方式的逆映射,对填充后的序列进行反标准化处理。

15.根据权利要求14所述的装置,其特征在于,按照预设的映射方式对所述待填充有序序列与各个参考序列进行标准化处理,包括:

对所述待填充有序序列与各个参考序列进行正态化处理;和/或,

将待填充有序序列与各个参考序列中的数值映射到预设取值范围内。

16.根据权利要求9-15中之一所述的装置,其特征在于,还包括异常值剔除模块:

确定待填充有序序列与各个参考序列的相似度之前,所述异常值剔除模块剔除待填充有序序列与各个参考序列中的异常值;

其中,所述异常值,包括:超出待填充有序序列或各个参考序列阈值的数值,和/或,不符合待填充有序序列或各个参考序列变化趋势的数值;其中,所述阈值是根据均值和/或标准差设置的。

17.一种填充有序序列的电子设备,其特征在于,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。

18.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。


技术总结
本发明公开了一种填充有序序列的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:确定待填充有序序列与各个参考序列的相似度;根据所述相似度,从所述多个参考序列中筛选目标参考序列;根据所述目标参考序列,对待填充有序序列进行填充。该实施方式克服了现有技术采用中值、均值、众数等统计学方法填充有序序列缺失处,未考虑有序序列的周期性、发展趋势、平滑性的技术缺陷,进而达到使得填充的缺失处的数值符合有序序列的周期性、发展趋势、并且使得填充更准确的技术效果。

技术研发人员:崔汝伟
受保护的技术使用者:北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
技术研发日:2018.05.09
技术公布日:2019.11.19
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1