一种数据检测方法及装置的制造方法

文档序号:8361662阅读:159来源:国知局
一种数据检测方法及装置的制造方法
【技术领域】
[0001] 本申请涉及数据检测技术领域,特别涉及一种数据检测方法及装置。
【背景技术】
[0002] 随着智能交通系统的不断发展及广泛应用,其城市交通诱导应用也逐步走向智能 化和动态化,在此基础上,智能交通系统通过每隔预定时间(如2分钟或5分钟)获取城市当 前的交通数据,并及时发布,以便用户能够及时的了解其所在城市当前的路况信息。由于目 前交通数据发布较为频繁,积累了大量的历史交通数据,因此,可以通过对历史交通数据进 行不同粒度、不同维度的分析,得到城市道路的交通运行规律,从而为城市交通信息的填补 及预测提供重要的依据。
[0003]目前,直接对城市的所有历史交通数据进行典型性分析,得到每条道路在每一类 典型日对应的每个统计时段的交通信息。
[0004] 在实际应用中,由于各种因素(如天气、交通事故等)均会导致城市历史交通数据 中的部分数据为异常数据,这部分异常数据实际可能并不能真实反映道路的交通情况,目 前的技术方案无法对这些异常数据进行检测,因此,直接对城市的所有历史交通数据进行 典型性分析得到每条道路在每一类典型日对应的每个统计时段的交通信息并不准确。

【发明内容】

[0005] 针对现有技术存在的所述技术问题,在根据历史交通数据分析各道路在每一类典 型日对应的每一个统计时段的交通信息之前,本申请提供一种数据检测方法及装置,将城 市历史交通数据中的异常数据检测出来,以确保用于分析典型性的历史交通数据均是能够 较为真实反映道路交通情况的数据,从而提高分析结果的准确性。
[0006] 本申请提供了一种数据检测方法,包括:
[0007] 获取目标数据,所述目标数据包括一目标道路在预设统计周期内每一天的历史交 通数据;
[0008] 按照预置的典型日类型,从所述目标数据中,筛选出发布日期符合所述典型日类 型的历史交通数据;
[0009] 对典型日类型相同且在预置的同一统计时段内的历史交通数据进行第一异常检 测,得到第一异常检测结果;
[0010] 对发布日期符合典型日类型的每一天的历史交通数据进行第二异常检测,得到第 二异常检测结果;
[0011] 将所述第一异常检测结果及所述第二异常检测结果,确定为所述目标数据的异常 数据检测结果。
[0012] 上述方法,优选的,所述对典型日类型相同且在预置的同一统计时段内的历史交 通数据进行第一异常检测,得到第一异常检测结果,包括:
[0013] 确定典型日类型相同且在预置的同一统计时段内的每个历史交通数据的U统计 量及拒绝域临界值;
[0014] 判断所述U统计量是否大于其拒绝域临界值,若是,则确定所述历史交通数据异 常,否则,确定所述历史交通数据正常。
[0015] 上述方法,优选的,所述对发布日期符合典型日类型的每一天的历史交通数据进 行第二异常检测,得到第二异常检测结果,包括:
[0016] 对发布日期符合典型日类型的每一天的历史交通数据执行以下步骤:
[0017] 将同一天的历史交通数据按照发布时间进行划分,得到历史交通数据序列;
[0018] 确定历史交通数据序列中每个历史交通数据的U统计量及其拒绝域临界值;
[0019] 判断所述U统计量是否大于其拒绝域临界值,若是,则确定所述历史交通数据异 常,否则,确定所述历史交通数据正常。
[0020] 上述方法,优选的,将同一天的历史交通数据按照发布时间进行划分,得到历史交 通数据序列,包括:
[0021] 将同一天的历史交通数据中,发布时间处于同一发布时间段的历史交通数据划分 到同一历史交通数据子序列中;
[0022] 从第一个历史交通数据子序列开始,依次获取相邻两个历史交通数据子序列的历 史交通数据均值U和方差C,其中,
【主权项】
1. 一种数据检测方法,其特征在于,包括: 获取目标数据,所述目标数据包括一目标道路在预设统计周期内每一天的历史交通数 据; 按照预置的典型日类型,从所述目标数据中,筛选出发布日期符合所述典型日类型的 历史交通数据; 对典型日类型相同且在预置的同一统计时段内的历史交通数据进行第一异常检测,得 到第一异常检测结果; 对发布日期符合典型日类型的每一天的历史交通数据进行第二异常检测,得到第二异 常检测结果; 将所述第一异常检测结果及所述第二异常检测结果,确定为所述目标数据的异常数据 检测结果。
2. 根据权利要求1所述的方法,其特征在于,所述对典型日类型相同且在预置的同一 统计时段内的历史交通数据进行第一异常检测,得到第一异常检测结果,包括: 确定典型日类型相同且在预置的同一统计时段内的每个历史交通数据的U统计量及 拒绝域临界值; 判断所述U统计量是否大于其拒绝域临界值,若是,则确定所述历史交通数据异常,否 贝1J,确定所述历史交通数据正常。
3. 根据权利要求1所述的方法,其特征在于,所述对发布日期符合典型日类型的每一 天的历史交通数据进行第二异常检测,得到第二异常检测结果,包括: 对发布日期符合典型日类型的每一天的历史交通数据执行以下步骤: 将同一天的历史交通数据按照发布时间进行划分,得到历史交通数据序列; 确定历史交通数据序列中每个历史交通数据的U统计量及其拒绝域临界值; 判断所述U统计量是否大于其拒绝域临界值,若是,则确定所述历史交通数据异常,否 贝1J,确定所述历史交通数据正常。
4. 根据权利要求3所述的方法,其特征在于,将同一天的历史交通数据按照发布时间 进行划分,得到历史交通数据序列,包括: 将同一天的历史交通数据中,发布时间处于同一发布时间段的历史交通数据划分到同 一历史交通数据子序列中; 从第一个历史交通数据子序列开始,依次获取相邻两个历史交通数据子序列的历史交 通数据均值μ和方差σ,其中
Xi为历史交通数据 子序列中第i个历史交通数据的取值,η为所述历史交通数据子序列中历史交通数据取值 的个数; 判断相邻两个历史交通数据子序列的均值μ和方差σ是否均对应相等,若是,将所述 两个历史交通数据子序列合并作为一个历史交通数据序列,否则,将上述两个历史交通数 据子序列分别作为历史交通数据序列。
5. 根据权利要求2或3所述的方法,其特征在于,确定历史交通数据的U统计量,包括: 根据
,确定所述历史交通数据的U统计量; 其中,U为所述历史交通数据的U统计量,Xi为第i个所述历史交通数据的取值,η为 典型日类型相同且在预置的同一统计时段内历史交通数据的个数,或者,η为数据序列中的 历史交通数据的个数,其4 /1
1 其中,确定所述历史交通数据的拒绝域临界值,包括: 根据P(U>y α/2) = α和预置的状态分布表,确定拒绝域临界值μ α/2,其中,α为预设的 检验水平值。
6. 根据权
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1