确定异常车流量数据的方法和装置与流程

文档序号:17471997发布日期:2019-04-20 05:52阅读:171来源:国知局
确定异常车流量数据的方法和装置与流程

本申请涉及计算机技术领域,具体涉及确定异常车流量数据的方法和装置。



背景技术:

现有技术中,围绕降低路灯在深夜的能耗问题,近几年发展出了多种路灯夜间节能控制方式,广泛运用的有分时段改变路灯工作数目和光照强度控制方式、跟踪车辆位置的来车亮灯式控制和根据路面实时车流量大小自动调节光照强度控制方式。后两种都是根据实时路面交通环境被动地进行控制,当深夜交通复杂多变时,对这种系统的响应速度与实时性有很大考验。随后又发展出基于最小二乘法算法的主动控制方式,其通过当天夜间历史车流数据拟合出车流变化曲线来预测未来车流量,使系统可以提前控制,这种主动控制方式加快了路灯控制的响应速度。

但是,上述的主动与被动控制方式只能机械地根据实时变化的车流状态和所预测的车流变化趋势进行相应控制,并不能分析这些车流变化在时间上的出现的规律。



技术实现要素:

本申请公开了一种确定异常车流量数据的方法和装置。

首先,本申请公开了一种确定异常车流量数据的方法,包括:获取至少一天的预设时间段内的车流量数据集合,取并集得到总车流量数据集合,车流量数据包含车流量和时间两个维度;对于总车流量数据集合进行采样,得到至少一个样本车流量数据集合;对于至少一个样本车流量数据集合中的每个样本车流量数据集合,基于该样本车流量数据集合对应的、预先训练的孤立树,确定该样本车流量数据集合中在车流量维度上的异常车流量数据,得到该样本车流量数据集合对应的第一异常车流量数据集合;对于各个第一异常车流量数据集合的并集中的各个异常车流量数据,基于预先训练的孤立树,确定在时间维度上的异常车流量数据,得到第二异常车流量数据集合。

可选的,该方法还包括:确定第一异常车流量数据集合与第二异常车流量数据集合的差集;确定差集中的各个车流量数据分布的至少一个时间区间。

可选的,该方法还包括:在至少一个时间区间内,控制路灯的工作模式符合预设条件。

可选的,对于总车流量数据集合进行采样,得到至少一个样本车流量数据集合,包括:对于车流量数据集合中选取目标数量的车流量数据,得到一个样本车流量数据集合,目标数量与总车流量数据集合中车流量总数的比值位于预设比例区间内。

可选的,样本车流量数据集合对应的孤立树通过以下步骤训练得到:将该样本车流量数据集合中的各个车流量数据输入孤立树的根节点;基于该样本车流量数据集合中的各个车流量数据在车流量维度的值,确定划分数值以将根节点划分为两个叶子节点;若叶子节点对应的车流量数据的数量大于一,继续对该叶子节点进行划分;若叶子节点对应的车流量数据的数量为1,训练结束,得到该样本车流量数据集合对应的孤立树。

其次,本申请还公开了一种确定异常车流量数据的装置,包括:获取单元,获取至少一天的预设时间段内的车流量数据集合,取并集得到总车流量数据集合,车流量数据包含车流量和时间两个维度;采样单元,用于对总车流量数据集合进行采样,得到至少一个样本车流量数据集合;第一确定单元,用于对于至少一个样本车流量数据集合中的每个样本车流量数据集合,基于该样本车流量数据集合对应的、预先训练的孤立树,确定该样本车流量数据集合中在车流量维度上的异常车流量数据,得到该样本车流量数据集合对应的第一异常车流量数据集合;第二确定单元,用于对于各个第一异常车流量数据集合的并集中的各个异常车流量数据,基于预先训练的孤立树,确定在时间维度上的异常车流量数据,得到第二异常车流量数据集合。

可选的,该装置还包括:差集确定单元,用于确定第一异常车流量数据集合与第二异常车流量数据集合的差集;时间区间确定单元,用于确定差集中的各个车流量数据分布的至少一个时间区间。可选的,该装置还包括:控制单元,用于在至少一个时间区间内,控制路灯的工作模式符合预设条件。

可选的,采样单元还用于:对于总车流量数据集合中选取目标数量的车流量数据,得到一个样本车流量数据集合,目标数量与车流量数据集合中车流量总数的比值位于预设比例区间内。

可选的,样本车流量数据集合对应的孤立树通过以下步骤训练得到:将该样本车流量数据集合中的各个车流量数据输入孤立树的根节点;基于该样本车流量数据集合中的各个车流量数据在车流量维度的值,随机确定划分数值以将根节点划分为两个叶子节点;若叶子节点对应的车流量数据的数量大于一,继续对该叶子节点进行划分;若叶子节点对应的车流量数据的数量为1,训练结束,得到该样本车流量数据集合对应的孤立树。

本申请提供的方法和装置,与现有技术中直接确定车流量数据集合中车流量较大的时间点相比,通过在车流量和时间维度串联应用孤立森林算法,可以确定总车流量数据集合中与多数车流量数据差异较大的车流量数据,即异常车流量数据。由于异常车流量数据可以体现时间上的分布规律,从而为根据时间规律控制路灯的工作模式提供了基础。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是根据本申请的确定异常车流量数据的方法的一个实施例的流程图;

图2是根据本申请的确定异常车流量数据的方法的又一个实施例的流程图;

图3是根据本申请的确定异常车流量数据的装置的一个实施例的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关申请,而非对该申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关申请相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1所示,示出了根据本申请的确定异常车流量数据的方法的一个实施例的流程。该确定异常车流量数据方法,包括以下步骤:

步骤101,获取至少一天的预设时间段内的车流量数据集合,取并集得到总车流量数据集合。

在本实施例中,确定异常车流量数据的方法的执行主体可以是硬件也可以是软件。作为示例,执行主体可以是路灯控制芯片或电路,也可以是安装于这些芯片中的控制软件(程序)等。在此基础上,执行主体可以首先从通信连接的其他电子设备或者本地获取至少一天的预设时间段内的车流量数据集合。其中,车流量数据可以包括车流量和时间两个维度。例如,车流量数据可以是二维数组。另外,时间维度可以以时、分为单位,不考虑日期。

在本实施例中,上述执行主体可以获取至少一天中的每天的车流量数据集合,也可以是获取至少一天中某些天的车流量数据集合。根据实际需要,至少一天可以是一周、一个月等等。此外,实践中,预设时间段可以是夜间的某一时间段。例如,晚上10:00至早上5:00。车流量数据集合可以是由采集设备以一定的采集频率(例如,20秒一次)采集得到的车流量数据所组成的集合。

步骤102,对于总车流量数据集合进行采样,得到至少一个样本车流量数据集合。

在本实施例中,上述执行主体可以对总车流量数据集合中的多个车流量数据通过多种采样方式(例如,随机采样)进行采样。根据实际需要,可以进行一次或多次采样。每次采样可以得到一个样本车流量数据集合。一次或多次采样可以得到至少一个样本车流量数据集合。

可选的,一次采样可以是从车流量数据集合中选取目标数量的车流量数据,得到一个样本车流量数据集合。目标数量与车流量数据集合中车流量总数的比值位于预设比例区间内。例如,目标数量可以小于或等于车流量总数的五分之三,且大于或等于车流量总数的二分之一。

步骤103,对于至少一个样本车流量数据集合中的每个样本车流量数据集合,基于该样本车流量数据集合对应的、预先训练的孤立树,确定该样本车流量数据集合中在车流量维度上的异常车流量数据,得到该样本车流量数据集合对应的第一异常车流量数据集合。

在本实施例中,上述执行主体可以对于至少一个样本车流量数据集合中的每个样本车流量数据集合,得到该样本车流量数据集合对应的第一异常车流量数据集合。

具体来说,对于每个样本车流量数据集合,可以预先训练对应的孤立树。其中,大量孤立树(itree)可以组成孤立森林(isolationtree,iforest)。

可选的,每个样本车流量数据集合对应的孤立树通过以下步骤训练得到:

第一步,将该样本车流量数据集合中的各个车流量数据输入孤立树的根节点。

第二步,基于该样本车流量数据集合中的各个车流量数据在车流量维度的值,确定划分数值以将根节点划分为两个叶子节点。

具体来说,可以在各个车流量数据在车流量维度的最大值和最小值之间随机选取一个值作为划分数值。在此基础上,对根节点的各个车流量数据进行二叉划分,将车流量维度的值小于划分数值的车流量数据划分到节点的左边,大于划分数值的车流量数据划分到节点的右边。这样得到的左右两个节点成为叶子节点。

作为示例,对于两个叶子节点,可以根据叶子节点对应的车流量数据的数量,确定是否继续进行划分。若叶子节点对应的车流量数据的数量大于1,继续对该叶子节点进行划分。若叶子节点对应的车流量数据的数量为1,训练结束,得到该样本车流量数据集合对应的孤立树。

可选的,对于两个叶子节点,也可以根据当前孤立树的高度,确定是否继续进行划分。

在本实施例中,可以通过以下步骤确定该样本车流量数据集合中在车流量维度上的异常车流量数据,得到该样本车流量数据集合对应的第一异常车流量数据集合。

第一步,将该样本车流量数据集合中的各个车流量数据在车流量维度的值输入对应的孤立树,从而得到从根节点至最终的叶子节点的路径长度。

第二步,根据得到的路径长度和异常分值计算公式,得到各个车流量数据对应的异常分值。

第三步,对于各个车流量数据中的每个车流量数据,如果该车流量数据对应的异常分值小于0.5,那么该车流量数据为正常数据。如果车流量数据对应的异常分值大于预设的分值阈值(例如,0.8),可以确定该车流量数据为异常车流量数据。各个异常车流量数据可以组成第一异常车流量数据集合。

由上述步骤可以得到每个样本车流量数据集合对应的第一异常车流量数据集合。

步骤104,对于各个第一异常车流量数据集合的并集中的各个异常车流量数据,基于预先训练的孤立树,确定在时间维度上的异常车流量数据,得到第二异常车流量数据集合。

在本实施例中,上述执行主体可以对于步骤103中得到的各个第一异常车流量数据求并集。对于并集中的每个异常车流量数据,可以基于预先训练的孤立树,确定在时间维度上的异常车流量数据,得到第二异常车流量数据集合。

其中,这里的孤立树的训练方法可以参考上述每个样本车流量数据集合对应的孤立树的训练方法。具体来说,可以基于并集中的各个异常车流量数据在时间维度的值,训练得到孤立树。在此基础上,可以将并集中的各个异常车流量数据输入训练好的孤立树,从而得到各个异常车流量数据的对应的异常分值。并根据异常分值,得到在时间维度上的异常车流量数据。在时间维度上的异常车流量数据组成第二异常车流量数据集合。

本申请的上述实施例,通过串联应用孤立森林算法,在车流量和时间维度串联应用孤立森林算法,可以确定车流量数据集合中与多数车流量数据差异较大的车流量数据,即异常车流量数据。并且,异常车流量数据可以体现时间上的分布规律。

继续参考图2,示出了根据本申请的确定异常车流量数据的方法的又一个实施例的流程。该确定异常车流量数据方法,包括以下步骤:

步骤201,获取至少一天的预设时间段内的车流量数据集合,取并集得到总车流量数据集合,车流量数据包含车流量和时间两个维度。

步骤202,对于总车流量数据集合进行采样,得到至少一个样本车流量数据集合。

步骤203,对于至少一个样本车流量数据集合中的每个样本车流量数据集合,基于该样本车流量数据集合对应的、预先训练的孤立树,确定该样本车流量数据集合中在车流量维度上的异常车流量数据,得到该样本车流量数据集合对应的第一异常车流量数据集合。

步骤204,对于各个第一异常车流量数据集合的并集中的各个异常车流量数据,基于预先训练的孤立树,确定在时间维度上的异常车流量数据,得到第二异常车流量数据集合。

在本实施例中,步骤201-204的具体实现及其所带来的技术效果可以参考图1对应的实施例中的步骤101-104,在此不再赘述。

步骤205,确定第一异常车流量数据集合与第二异常车流量数据集合的差集。

在本实施例中,上述执行主体可以确定第一异常车流量数据集合与第二异常车流量数据集合的差集。实践中,以车流量数据集合是在晚上10:00至早上5:00的时间段内采集的车流量数据组成的集合为例。一般来说,这个时间段内的车流量较小,那么第一异常车流量数据集合可以看作是车流量较大的车流量数据的集合。进一步的,第二异常车流量数据集合可以看作是在时间上较为稀疏的异常车流量数据组成的集合。在此基础上,可以确定第一异常车流量数据集合与第二异常车流量数据集合的差集。从而差集中的异常车流量数据可以看作是时间分布集中的异常车流量数据。也就是说,差集中的异常车流量数据在时间维度上分布比较集中。

步骤206,确定差集中的各个车流量数据分布的至少一个时间区间。

在本实施例中,由于步骤205中确定的差集中的异常车流量数据在时间维度上分布比较集中。从而可以得到集中分布的至少一个时间区间。该时间区间即为所述深夜异常车流量数据的出现规律。

步骤207,在至少一个时间区间内,控制路灯的工作模式符合预设条件。

在本实施例中,在至少一个时间区间内,上述执行主体可以控制路灯的工作模式符合预设条件。作为示例,可以控制路灯的工作模式大于预设的亮度阈值或处于预设的亮度模式。

在本实施例中,与图1对应的实施例相比,本实施例增加了根据第二异常车流量数据集合与第一异常车流量数据集合,确定异常车流量数据在时间维度上的集中分布的时间区间的步骤。从而根据至少一个时间区间,控制路灯的工作模式。从而可以实现在不同时间区间内有针对性的工作模式控制。

继续参考图3,示出了根据本申请的确定异常车流量数据的装置的一个实施例的结构示意图。该确定异常车流量数据的装置可以应用于各种电子设备中。

在本实施例中,确定异常车流量数据的装置,包括:获取单元301、采样单元302、第一确定单元303和第二确定单元304。其中,获取单元301用于获取总深夜车流量数据集合,车流量数据包含车流量和时间两个维度。采样单元302,用于对于总深夜车流量数据集合进行采样,得到至少一个样本车流量数据集合。第一确定单元303,用于对于至少一个样本车流量数据集合中的每个样本车流量数据集合,基于该样本车流量数据集合对应的、预先训练的孤立树,确定该样本车流量数据集合中在车流量维度上的异常车流量数据,得到该样本车流量数据集合对应的第一异常车流量数据集合。第二确定单元304,用于对于各个第一异常车流量数据集合的并集中的各个异常车流量数据,基于预先训练的孤立树,确定在时间维度上的异常车流量数据,得到第二异常车流量数据集合。

可选的,该装置还可以包括:差集确定单元(图中未示出)。其中,差集确定单元用于确定第一异常车流量数据集合与第二异常车流量数据集合的差集;时间区间确定单元,用于确定差集中的各个车流量数据分布的至少一个时间区间。

可选的,该装置还可以包括:控制单元(图中未示出)。其中,控制单元用于在至少一个时间区间内,控制路灯的工作模式符合预设条件。

可选的,采样单元302还用于:对于车流量数据集合中选取目标数量的车流量数据,得到一个样本车流量数据集合,目标数量与车流量数据集合中车流量总数的比值位于预设比例区间内。

可选的,样本车流量数据集合对应的孤立树通过以下步骤训练得到:将该样本车流量数据集合中的各个车流量数据输入孤立树的根节点;基于该样本车流量数据集合中的各个车流量数据在车流量维度的值,确定划分数值以将根节点划分为两个叶子节点;若叶子节点对应的车流量数据的数量大于一,继续对该叶子节点进行划分;若叶子节点对应的车流量数据的数量为1,训练结束,得到该样本车流量数据集合对应的孤立树。

在本实施例中,通过过第一确定单元303和第二确定单元304串联应用孤立森林算法,在车流量和时间维度串联应用孤立森林算法,可以确定深夜总车流量数据集合中与多数车流量数据差异较大的车流量数据,即异常车流量数据。由于异常车流量数据可以体现时间上的分布规律。

特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。

需要说明的是,本申请的计算机可读存储介质包括:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)等等。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。

此外,附图中的流程图和框图,图示了按照本申请的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、采样单元、第一确定单元和第二确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“用于获取车流量数据集合的单元”。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1