一种交通轨迹数据降噪方法及系统的制作方法

文档序号:6491964阅读:267来源:国知局
一种交通轨迹数据降噪方法及系统的制作方法
【专利摘要】本发明适用于智能交通【技术领域】,提供了一种交通轨迹数据降噪方法及系统,所述方法包括:对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示;对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果;根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据;去除查找的交通轨迹数据中的异常轨迹数据。本发明使得交通轨迹数据的降噪过程简单、效率高。
【专利说明】一种交通轨迹数据降噪方法及系统
【技术领域】
[0001]本发明属于智能交通【技术领域】,尤其涉及一种交通轨迹数据降噪方法及系统。
【背景技术】
[0002]近年来城市机动车的数量急速增长,引发了许多交通问题,诸如堵车、停车难、打车难等,因此,在未来构建智能城市的蓝图中,智能交通可谓是重中之重。对于智能交通的建设,必然会涉及到对于大规模交通轨迹数据的处理,然而,由于卫星导航的误差、网络通信的延迟以及异常信号的干扰等不可预料的原因,交通轨迹数据中存在大量异常轨迹数据,这些数据严重影响对交通轨迹分析的客观性。于是,如何去除海量交通轨迹数据中的异常交通轨迹数据成为了一个技术热点。
[0003]现有的技术是通过设置不同的降噪规则去除交通轨迹数据中的异常交通轨迹数据,即判断交通轨迹数据上的GPS坐标点是否满足预先设置的降噪规则,然而,在实际降噪过程中,为了获得高质量的交通轨迹数据,通常将降噪规则设置的非常复杂,因此,降噪过程复杂,且执行效率低。

【发明内容】

[0004]本发明实施例的目的在于提供一种交通轨迹数据降噪方法,旨在解决现有技术交通轨迹数据的降噪过程复杂,且执行效率低的问题。
[0005]为了实现上述目的,本发明实施例提供如下技术方案:
[0006]本发明实施例是这样实现的,一种交通轨迹数据降噪方法,所述方法包括:
[0007]对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示;
[0008]对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果;
[0009]根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据;
[0010]去除查找的交通轨迹数据中的异常轨迹数据。。
[0011]本发明实施例还提供了一种交通轨迹数据降噪系统,所述系统包括:
[0012]预处理单元,用于对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示;
[0013]聚类单元,用于对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果;
[0014]查找单元,用于根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据;
[0015]去除单元,用于去除查找的交通轨迹数据中的异常轨迹数据。
[0016]本发明实施例与现有技术相比,有益效果在于:通过对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示,对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果,根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据,去除查找的交通轨迹数据中的异常轨迹数据,降噪过程简单、效率高。
【专利附图】

【附图说明】[0017]为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本发明实施例一提供的交通轨迹数据降噪方法的实现的流程图;
[0019]图2是本发明实施例一提供的现有技术对交通轨迹数据进行处理的结果图;
[0020]图3是本发明实施例一提供的本发明对交通轨迹数据进行处理的结果图;
[0021]图4是本发明实施例二提供的交通轨迹数据进行预处理方法的实现的流程图;
[0022]图5是本发明实施例三提供的交通轨迹数据降噪系统的结构图;
[0023]图6是本发明实施例四提供的交通轨迹数据降噪系统的结构图。
【具体实施方式】
[0024]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0025]本发明实施例提供了一种交通轨迹数据降噪方法,所述方法包括:
[0026]对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示;
[0027]对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果;
[0028]根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据;
[0029]去除查找的交通轨迹数据中的异常轨迹数据。。
[0030]本发明实施例还提供了一种交通轨迹数据降噪系统,所述系统包括:
[0031]预处理单元,用于对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示;
[0032]聚类单元,用于对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果;
[0033]查找单元,用于根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据;
[0034]去除单元,用于去除查找的交通轨迹数据中的异常轨迹数据。
[0035]以下结合具体实施例对本发明的实现进行详细描述:
[0036]实施例一
[0037]图1示出了本发明实施例一提出的交通轨迹数据降噪方法的实现的流程图,详述如下:
[0038]在SlOl中,对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示;
[0039]在S102中,对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果;
[0040]本实施例中,为了将交通轨迹数据进行分类处理,将向量表示的交通轨迹数据进行聚类处理,聚类处理结果可以将交通轨迹数据中相同或者相似的轨迹数据划分成一类,从而方便后续的数据处理。
[0041]在S103中,根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据;
[0042]本实施例中,S103具体可以采用以下方式实现:
[0043]1、根据所述聚类处理结果,确定每一交通轨迹数据的向量所属的类,所述聚类处理结果包括多个类;[0044]2、判断所述交通轨迹数据的向量所属的类的中心向量与所述交通轨迹数据的向量之间的距离是否小于预设阈值,若是,判定所述交通轨迹数据为异常交通轨迹数据。
[0045]以下通过一个例子进行说明,但不以此例子的情况为限,假设所述聚类处理结果
包括k个类,每一个类的中心向量分别为ICpC2......Cj......Ck},预设阈值为R,对于一个
交通轨迹数据的结果向量为在聚类处理结果中查找,确定所述ri属于第j个类,判断所述|^-(:」>1?,则判定向量1^为异常交通轨迹数据。
[0046]在S104中,去除查找的交通轨迹数据中的异常轨迹数据。
[0047]以下分别采用现有技术交通轨迹数据降噪方法及本实施例提供的交通轨迹数据降噪方法对交通轨迹数据进行处理的结果,数据来源于深圳市在2010年8月一个月内20000辆出租车的运营数据,每辆出租车每分钟向数据处理中心发送一条信息。数据的存储格式为普通文本,文本的每一行为一条记录,全部数据为20000个文本文件,大小约为50GB,本示例中,通过对A、B两点间的交通轨迹数据进行处理结果如下:如图2为现有技术方法对交通轨迹数据进行处理结果图,图3为本发明方法对交通轨迹数据进行处理结果图,可见,通过本发明方法可以有效去除交通轨迹数据中的异常交通轨迹数据。[0048]本发明实施例中,通过对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示,对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果,根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据,去除查找的交通轨迹数据中的异常轨迹数据,使得降噪过程简单、效率高。
[0049]实施例二
[0050]图4示出了本发明实施例二提供的交通轨迹数据进行预处理方法的实现的流程图,详述如下:
[0051]在S401中,获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系。
[0052]本实施例中,将交通轨迹数据定义在一个二维坐标系中,假设该坐标系为α,包括X轴和Y轴,其中,一条交通轨迹数据为一个有向的GPS坐标点的集合,所以可以将X轴定义为所述GPS坐标点的经度,将Y轴定义为所述GPS坐标点的纬度,当然,上述GPS坐标点在坐标系中的对应方式仅是一种实现方式,在实际使用中可以根据用户需要进行设置,另外,本发明实施例中,其它部分均以此实施例中定义的坐标系为例进行说明。
[0053]本实施例中,S401具体可以下方式:对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
[0054]在S402中,按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系。
[0055]本实施例中,可以将第一坐标系进行合适的变换以最大限度地捕捉交通轨迹的特征,例如,可以将第一坐标系旋转一定的角度,形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系。
[0056]在S403中,在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0057]本实施例中,通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0058]在S404中,在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合。
[0059]在S405中,通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合。
[0060]在S406中,根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表
/Jn ο
[0061]为了便于理解,以下以一个具体的实现实例对本实施例中交通轨迹数据降噪的过程进行说明,但不以本实施例的情况为限,具体如下,仍然S401中所述的坐标系为例进行说明:
[0062]1、通过查询,可以获得经过任意两个位置之间的所有轨迹:对于一个起点(xs,ys)的查询,设置一个距离阈值ε,对于GPS坐标(X' s,y' s),这里有x' s e (xs-ε,xs-ε )并且y' e (ys-e,ys-e),并且,对于一个终点(χ。,y。)查询,设置一个距离阈值ε ',对于 GPS 坐标(X' d, y' d)这里有 X' d e (xd-e ',xd-e ')并且 y' d e (yd-ε ',yd_e'),则把所有经过(X' s,y' s)和(X' d,y' d)的交通轨迹数据放入待处理列的交通轨迹数据列表中,记为D。
[0063]2、连接起点(xs,ys)和终点(xd,yd)间的线段,记为L,假设L与X轴之间的夹角为α,则将第一坐标系坐标轴向左旋转α-45°,形成新的坐标系S’,将交通轨迹数据列表D中的所有点转换成S’中的点,形成新的交通轨迹数据列表,记为D’。
[0064]3、通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0065]4、基于S’,在X轴的[xs,xd]范围内,取η个点,记为有序样本点集合X= {x1;.,X1J,同样的方法,在Y轴的[ys,yd]上取m个点,记为有序样本点集合Y’ = {y' 1;...,y' m},X和Y’为采样获得的样本点集合,其中,m、n为自然数。
[0066]5、通过所述有序的线段集合,计算样本点集合X中的样本点Xi (Xi e X)在Y轴上的映射,记为Y= Iy1,...,ym},其中,样本集合X的Xi与映射样本点集合Y中项yi对应。通过所述有序的线段集合,计算样本点集合Y’中的样本点y, t(y, teY')在X轴上的映射,记为Χ’={χ^ !,...Xi J,其中,样本集合Y’中的项太t与映射样本点集合X’中项Xi i对应。
[0067]6、根据映射样本点集合Y和X’生成交通轨迹数据的向量表示为:Y-X'=ι?...,ym? X I?...? X m}。[0068]本实施例中,通过将交通轨迹数据所在的第一坐标系进行旋转至第二坐标系,并在第二坐标系中将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合,并在所述起点和终点在不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合,并通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合,根据不 同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示,通过根据交通轨迹数据的走向特征,对交通轨迹数据进行规模规范化的预处理处理,实现对交通轨迹数据的正确、且快速的分类,处理过程的时间复杂度低,速度快,方便后续进行数据分析及数据挖掘。[0069]实施例三
[0070]图5示出了本发明实施例三提供的交通轨迹数据降噪系统的结构图,为了便于说明,仅示出了与本发明实施例相关的部分,该装置可以是内置于交通轨迹数据处理终端中的软件单元、硬件单元或者软硬结合单元。
[0071]所述系统包括:预处理单元51、聚类单元52、查找单元53及去除单元54。
[0072]预处理单元51,用于对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示;
[0073]聚类单元52,用于对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果;
[0074]查找单元53,用于根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据;
[0075]去除单元54,用于去除查找的交通轨迹数据中的异常轨迹数据。
[0076]可选的,所述查找单元53包括:
[0077]确定模块531,用于根据所述聚类处理结果,确定每一交通轨迹数据的预处理向量所属的类,所述聚类处理结果包括多个类;
[0078]判断模块532,用于判断所述交通轨迹数据的预处理向量所属的类的中心向量与所述交通轨迹数据的预处理向量之间的距离是否小于预设阈值,若是,判定所述交通轨迹数据为异常交通轨迹数据。
[0079]本发明实施例提供的交通轨迹数据降噪系统可以使用在前述对应的方法实施例一中,详情参见上述实施例一的描述,在此不再赘述。
[0080]实施例四
[0081]图6示出了本发明实施例三提供的交通轨迹数据降噪系统的结构图,为了便于说明,仅示出了与本发明实施例相关的部分,该装置可以是内置于交通轨迹数据处理终端中的软件单元、硬件单元或者软硬结合单元。
[0082]所述系统包括:预处理单元61、聚类单元62、查找单元63及去除单元64。
[0083]所述预处理单元61包括:获取模块611、旋转模块612、转换模块613、采样模块614、计算模块615以及向量生成模块616。
[0084]获取模块611,用于获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系;
[0085]旋转模块612,用于按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系;
[0086]转换模块613,用于在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合;
[0087]采样模块614,用于在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;
[0088]计算模块615,用于通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合;
[0089]向量生成模块616,用于根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。[0090]可选的,所述获取模块611,具体用于对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
[0091]可选的,所述转换模块613,具体用于通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0092]可选的,所述第二坐标系的不同坐标轴为X轴和Y轴,所述采样模块414,具体用于在所述起点和终点在所述X轴的投影范围内,进行采样,获得X轴样本点集合X ;以及在所述起点和终点在所述Y轴的投影范围内,进行采样,获得Y轴样本点集合Y’。
[0093]所述计算模块614,具体用于通过所述有序的线段集合,计算所述样本点集合X在Y轴上的映射样本点集合Y ;以及计算所述样本点集合Y’在X轴上的映射样本点集合V。
[0094]本发明实施例提供的交通轨迹数据降噪系统可以使用在前述对应的方法实施例二中,详情参见上述实施例二的描述,在此不再赘述。
[0095]值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0096]另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如R0M/RAM、磁盘或光盘等。
[0097]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种交通轨迹数据降噪方法,其特征在于,所述方法包括: 对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示; 对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果; 根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据; 去除查找的交通轨迹数据中的异常轨迹数据。
2.如权利要求1所述的方法,其特征在于,所述对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示的过程具体为: 获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系; 按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系; 在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合; 在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合; 通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合; 根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
3.如权利要求2所述的方法,其特征在于,所述获取任意起点和终点之间的待处理的交通轨迹数据具体为: 对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
4.如权利要求2所述的方法,其特征在于,在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合具体为: 通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
5.如权利要求1至4任一权利要求所述的方法,其特征在于,所述根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据具体为: 根据所述聚类处理结果,确定每一交通轨迹数据的向量所属的类,所述聚类处理结果包括多个类; 判断所述交通轨迹数据的向量所属的类的中心向量与所述交通轨迹数据的向量之间的距离是否小于预设阈值,若是,判定所述交通轨迹数据为异常交通轨迹数据。
6.一种交通轨迹数据降噪系统,其特征在于,所述系统包括: 预处理单元,用于对交通轨迹数据进行预处理,获取交通轨迹数据的向量表示; 聚类单元,用于对向量表示的交通轨迹数据进行聚类处理,获取聚类处理结果; 查找单元,用于根据所述聚类处理结果,查找所述交通轨迹数据中的异常轨迹数据; 去除单元,用于去除查找的交通轨迹数据中的异常轨迹数据。
7.如权利要求6所述的系统,其特征在于,所述预处理单元包括:获取模块,用于获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系; 旋转模块,用于按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系; 转换模块,用于在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合; 采样模块,用于在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合; 计算模块,用于通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合; 向量生成模块,用于根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
8.如权利要求7所述的系统,其特征在于,所述获取模块,具体用于对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
9.如权利要求7所述的系统,其特征在于,所述转换模块,具体用于通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
10.如权利要求6所述的系统,其特征在于,所述查找单元包括: 确定模块,用于根据所述聚类处理结果,确定每一交通轨迹数据的向量所属的类,所述聚类处理结果包括多个类; 判断模块,用于判断所述交通轨迹数据的向量所属的类的中心向量与所述交通轨迹数据的向量之间的距离是否小于预设阈值,若是,判定所述交通轨迹数据为异常交通轨迹数据。
【文档编号】G06F17/30GK103853725SQ201210499154
【公开日】2014年6月11日 申请日期:2012年11月29日 优先权日:2012年11月29日
【发明者】邹瑜斌, 张帆, 李晔, 白雪, 须成忠 申请人:深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1