异常车速数据的识别方法和装置的制作方法

文档序号:6698968阅读:228来源:国知局
专利名称:异常车速数据的识别方法和装置的制作方法
技术领域
本发明涉及智能交通领域,尤其涉及一种异常车速数据的识别方法和装置。
背景技术
智能交通系统是目前能全面有效地解决交通运输领域问题,特别是交通拥挤、交 通阻塞、交通事故和交通污染等的最佳途径。其中,动态交通信息服务是智能交通系统的核 心研究方向之一,它可以动态实时反映区域内的交通路况,指引最佳的行驶路线,提高道路 和车辆的使用效率,是缓解交通拥堵状况的重要措施。在动态交通信息的研究中,分析道路 历史车速值,找到能够反映道路周期性趋势的参数,进而提取出道路的动态交通特征是个 热点问题。但是由于在车速数据的采集和处理输出过程中存在各种干扰,会使车速数据受 到不同程度的噪声污染,使用被污染的数据建模和统计分析,可能会导致错误结果,故而需 要对车速数据进行除噪,即识别并删除异常车速值。现有技术中用于识别异常数据的主要 方法有统计方法、基于距离的方法和基于密度聚类的方法。 然而,在将统计方法和基于距离的方法用于识别异常车速数据的过程中,发明人 发现现有技术中至少存在如下问题采用统计方法识别异常车速数据时通常要求知道关于 数据集参数的知识,如分布模型,分布参数等。但是在大多数情况下,分布可能是未知的。采 用基于距离的方法识别异常车速数据时需要根据某个距离函数来计算数据对象之间的距 离,异常数据是那些与所有其他对象相比有更高距离的数据对象。但是它需要用户直接提 供最小的可接受距离,而这个是很难确定的。而基于密度聚类的方法可以从未知分布形式 的数据中识别出异常数据,但是现有技术中还没有将基于密度聚类的方法用于识别异常车 速数据。

发明内容
本发明的实施例提供一种异常车速数据的识别方法和装置,采用基于密度聚类的
方法实现了从目标车速数据集中识别异常车速数据。 为达到上述目的,本发明的实施例采用如下技术方案 —种异常车速数据的识别方法,包括 根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离;
从所有上述k-距离中选出所述目标车速数据集的半径参数;
将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。
—种异常车速数据的识别装置,包括 计算单元,用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的 k-距离; 选择单元,用于从所有上述k-距离中选出所述目标车速数据集的半径参数;
第一标识单元,用于将大于所述半径参数的k-距离对应的车速数据对象标识为 异常车速数据。
由上述方案描述的本发明实施例中,所述预设的参数k为基于密度聚类的方法中 的密度阈值,根据所述预设的参数k可以计算出目标车速数据集中每一个车速数据对象的 k_距离。所述车速数据对象的k_距离为所述车速数据对象到其k个最邻近的车速数据对 象的最大距离。计算出所述目标数据集中所有车速数据对象的k_距离之后,从所有上述 k-距离中选出所述目标车速数据集的半径参数。所述目标车速数据集的半径参数即为基于 密度聚类的方法中的密度聚类的半径。通过依次比较所述目标数据集中的每个车速数据对 象的k-距离与所述目标车速数据集的半径参数的大小,将大于所述半径参数的k-距离对 应的车速数据对象标识为异常车速数据。从而实现了将基于密度聚类的方法用于识别异常 车速数据。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
图1为实施例1异常车速数据的识别方法的流程图;
图2为实施例1异常车速数据的识别装置的结构框图;
图3为实施例2异常车速数据的识别方法的流程图;
图4为实施例2异常车速数据的识别装置的结构框图。
具体实施例方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
实施例1 : 本发明实施例提供一种异常车速数据的识别方法,如图1所示,该方法包括以下 步骤 101、根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。
由于基于密度聚类的方法通过设置密度阈值与领域半径从任意形状的簇中识别 异常数据,因此在将基于密度聚类的方法用于识别异常车速数据时,也要设置密度阈值与 领域半径的值。所述预设参数k即为基于密度聚类的方法中的密度阈值,可以通过技术人 员的经验设定参数k。 所述车速数据对象的k-距离可以定义为车速数据对象p与车速数据对象0 G D 之间的距离dist(p, o),且满足 ①至少有k个车速数据对象对象q G D\ {p},使得dist (p, q)《dist (p, o);
②并且至多有(k-l)个车速数据对象对象q G D\ {p},使得dist (p, q) < dist (p, o)。 102、从所有上述k-距离中选出所述目标车速数据集的半径参数。所述目标数据
4集中每一个车速数据对象都有对应的k_距离,从所有上述k_距离中选择一个k_距离作为所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。 103、所述密度阈值与领域半径的值确定之后,根据基于密度聚类的方法,将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。从而实现了将基于密度聚类的方法应用于识别异常车速数据。 为了实现上述方法,本发明实施例还提供一种异常车速数据的识别装置,如图2所示,该装置包括计算单元21、选择单元22和第一标识单元23。 其中,所述计算单元21用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。所述计算单元21计算出每一个车速数据对象的k-距离之后,选择单元22用于从所有上述k-距离中选出所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。基于密度聚类的方法中的密度阈值和领域半径都确定之后,第一标识单元23用于将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。该装置通过计算单元21和选择单元22来确定基于密度聚类的方法中的密度阈值和领域半径,第一标识单元23根据基于密度聚类的方法通过比较所述目标数据集中的每个车速数据对象的k-距离与所述目标车速数据集的半径参数的大小,从所述目标数据集中识别出异常车速数据。从而实现了将基于密度聚类的方法用于识别异常车速数据。 实施例2 : 本发明实施例以指定路链上历史交通流为例来详细介绍异常车速数据的识别方法,如图3所示,该方法包括如下步骤 301、加载目标数据集。所述目标数据集可以为指定路链上某个星期特征日中特定时间点的车速值。如从一年的车速数据对象中取目标数据集时,由于车速值可能有丢失的现象,所述目标数据集中最多有52个车速值。所述星期特征日是指一周中交通流数据变化具有一定相似特征的某些日期的集合。如一周的日期可以简单地分为工作日和周日两类星期特征日,也可以按交通流的周相似性细分为周一到周日共7个特征日等。
302、根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。所述预设参数k即为基于密度聚类的方法中的密度阈值,可以通过技术人员的经验设定参数k。 303、将所有上述k-距离按照递增次序进行排序。对于上述所有车速数据对象的k-距离,以递增次序进行排序。然后按纵坐标为k-距离,横坐标为点的个数排序,如1、2、3等,分别用以表示第一个车速数据、第二个车速数据、第三个车速数据等,绘制排序后的值。
304、选择所述k-距离增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数。可以采用导数的方法来确定所述k-距离增量变化的大小。将所述k-距离作为因变量,所述点的个数作为自变量。相对于点的个数值的增量计算所述k-距离的增量的变化大小,取增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。 305、所述密度阈值与领域半径的值确定之后,根据基于密度聚类的方法,将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。将异常车速数据识别出来之后,可以删除所述异常车速数据。 306、将等于所述半径参数的k-距离对应的车速数据对象标识为边界车速数据。
307、将小于所述半径参数的k-距离对应的车速数据对象标识为核心车速数据。本方法中采用基于密度聚类的方法,不仅实现了从目标数据集中识别异常车速数据,同时也识别出边界车速数据和核心车速数据,为研究历史交通流中的车速变化提供依据。
本发明实施例还提供一种异常车速数据的识别装置,如图4所示,包括加载单元41、计算单元42、选择单元43、第一标识单元44、第二标识单元45和第三标识单元46。
其中,所述加载单元41用于将目标数据集加载到缓存中。所述目标数据集可以为指定路链上某个星期特征日中特定时间点的车速值。所述加载单元41加载目标数据集之后,所述计算单元42用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离。 然后,所述选择单元43用于从所有上述k-距离中选出所述目标车速数据集的半径参数。所述选择单元43包括排序模块43A和选择模块43B。所述排序模块43A用于将所有上述k-距离按照递增次序进行排序。选择模块43B用于选择所述k-距离增量变化最大时对应的k-距离作为所述目标车速数据集的半径参数。所述半径参数即为基于密度聚类的方法中的领域半径的值。通过计算单元42和选择单元43确定了基于密度聚类的方法中的密度阈值和领域半径。 然后,根据基于密度聚类的方法通过比较所述目标数据集中的每个车速数据对象的k-距离与所述目标车速数据集的半径参数的大小,第一标识单元44用于将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。第二标识单元45用于将等于所述半径参数的k-距离对应的车速数据对象标识为边界车速数据。第三标识单元46用于将小于所述半径参数的k-距离对应的车速数据对象标识为核心车速数据。从而基于密度聚类的方法实现了从目标数据集中识别异常车速数据。 本发明实施例主要应用于智能交通领域,实现了将基于密度聚类的方法用于识别异常车速数据。 通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。 以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
一种异常车速数据的识别方法,其特征在于,包括根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离;从所有上述k-距离中选出所述目标车速数据集的半径参数;将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。
2. 根据权利要求1所述的异常车速数据的识别方法,其特征在于,所述从所有车速数 据对象的k-距离中选出所述目标车速数据集的半径参数包括将所有上述k_距离按照递增次序进行排序;选择所述k-距离增量变化最大时对应的k_距离作为所述目标车速数据集的半径参数。
3. 根据权利要求1所述的异常车速数据的识别方法,其特征在于,还包括 将等于所述半径参数的k_距离对应的车速数据对象标识为边界车速数据; 将小于所述半径参数的k-距离对应的车速数据对象标识为核心车速数据。
4. 一种异常车速数据的识别装置,其特征在于,包括计算单元,用于根据预设参数k,计算目标车速数据集中每一个车速数据对象的k_距离;选择单元,用于从所有上述k-距离中选出所述目标车速数据集的半径参数; 第一标识单元,用于将大于所述半径参数的k-距离对应的车速数据对象标识为异常 车速数据。
5. 根据权利要求4所述的异常车速数据的识别装置,其特征在于,所述选择单元包括 排序模块,用于将所有上述k_距离按照递增次序进行排序;选择模块,用于选择所述k-距离增量变化最大时对应的k_距离作为所述目标车速数 据集的半径参数。
6. 根据权利要求4所述的异常车速数据的识别装置,其特征在于,还包括第二标识单元,用于将等于所述半径参数的k-距离对应的车速数据对象标识为边界 车速数据;第三标识单元,用于将小于所述半径参数的k-距离对应的车速数据对象标识为核心 车速数据。
全文摘要
本发明公开一种异常车速数据的识别方法和装置,涉及智能交通领域,解决了现有技术中还没有将基于密度聚类的方法用于识别异常车速数据的问题。该方法包括根据预设参数k,计算目标车速数据集中每一个车速数据对象的k-距离;从所有上述k-距离中选出所述目标车速数据集的半径参数;将大于所述半径参数的k-距离对应的车速数据对象标识为异常车速数据。本发明实施例主要应用于智能交通领域。
文档编号G08G1/052GK101727749SQ200910237940
公开日2010年6月9日 申请日期2009年11月19日 优先权日2009年11月19日
发明者付新刚, 昝艳, 李建军, 贾学力 申请人:北京世纪高通科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1