一种交通轨迹数据预处理方法及系统的制作方法

文档序号:6491960阅读:265来源:国知局
一种交通轨迹数据预处理方法及系统的制作方法
【专利摘要】本发明适用于智能交通【技术领域】,提供了一种交通轨迹数据预处理方法及系统,所述方法包括:获取任意起点和终点之间的交通轨迹数据,所述交通轨迹数据位于第一坐标系中;旋转所述第一坐标系形成第二坐标系;在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合;在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合;根据映射样本点集合,生成交通轨迹数据的向量表示。本发明实现对交通轨迹数据进行规模规范化的预处理,处理过程的时间复杂度低,速度快。
【专利说明】一种交通轨迹数据预处理方法及系统
【技术领域】
[0001]本发明属于智能交通【技术领域】,尤其涉及一种交通轨迹数据预处理方法及系统。【背景技术】
[0002]交通轨迹数据主要有以下特点:(I)数据量大,假设某城市有50000台出租车,每台出租车每隔5秒钟向云服务中心发送一条包含其当前位置、当前时间、载人情况、司机电话号码等的记录,一条记录大约100个字节,则每个月大约会产生2.6TB的数据量;(2)异常数据多并且复杂,交通轨迹数据的完整性和正确性受到卫星定位的精度,定位设备的参数,网络信号的强度等多种客观并且不可预知的因素的影响,导致轨迹数据中存在大量异常数据;(3)对处理速度要求高,大量交通轨迹数据量要求在预设的时间内处理完,所以对于算法的时间复杂度要求高。基于此,在对交通轨迹数据进行数据挖掘及数据分析之前对数据进行预处理就变得十分重要,而现有技术还没有对交通轨迹数据进行预处理的方法。

【发明内容】

[0003]本发明实施例的目的在于提供一种交通轨迹数据预处理方法,旨在解决现有技术还没有对交通轨迹数据进行预处理的方法的问题。
[0004]为了实现上述目的,本发明实施例提供如下技术方案:
[0005]本发明实施例是这样实现的,一种交通轨迹数据预处理方法,所述方法包括:
[0006]获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系;
[0007]按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系;
[0008]在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合;
[0009]在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;
[0010]通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合;
[0011]根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
[0012]本发明实施例还提供了一种交通轨迹数据预处理系统,所述系统包括:
[0013]获取单元,用于获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系;
[0014]旋转单元,用于按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系;
[0015]转换单元,用于在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合;[0016]采样单元,用于在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;
[0017]计算单元,用于通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合;
[0018]向量生成单元,用于根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
[0019]本发明实施例与现有技术相比,有益效果在于:通过将交通轨迹数据所在的第一坐标系进行旋转至第二坐标系,并在第二坐标系中将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合,并在所述起点和终点在不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合,并通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合,根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。通过根据交通轨迹数据的走向特征,对交通轨迹数据进行规模规范化的预处理处理,实现对交通轨迹数据的正确、且快速的分类,处理过程的时间复杂度低,速度快,方便后续进行数据分析及数据挖掘。
【专利附图】

【附图说明】
[0020]为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本发明实施例一提出的交通轨迹数据预处理方法的实现的流程图;
[0022]图2是本发明实施例二提出的交通轨迹数据预处理系统的结构图。
【具体实施方式】
[0023]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0024]本发明实施例提供了一种交通轨迹数据预处理方法,所述方法包括:
[0025]获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系;
[0026]按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系;
[0027]在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合;
[0028]在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;
[0029]通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合;
[0030]根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。[0031]本发明实施例还提供了一种交通轨迹数据预处理系统,所述系统包括:
[0032]获取单元,用于获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系;
[0033]旋转单元,用于按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系;
[0034]转换单元,用于在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合;
[0035]采样单元,用于在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;
[0036]计算单元,用于通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合;
[0037]向量生成单元,用于根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
[0038]以下结合具体实施例对本发明的实现进行详细描述:
[0039]实施例一
[0040]图1示出了本发明实施例一提出的交通轨迹数据预处理方法的实现的流程图,详述如下:
[0041]在SlOl中,获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系。
[0042]本实施例中,将交通轨迹数据定义在一个二维坐标系中,假设该坐标系为α,包括X轴和Y轴,其中,一条交通轨迹数据为一个有向的GPS坐标点的集合,所以可以将X轴定义为所述GPS坐标点的经度,将Y轴定义为所述GPS坐标点的纬度,当然,上述GPS坐标点在坐标系中的对应方式仅是一种实现方式,在实际使用中可以根据用户需要进行设置,另外,本发明实施例中,其它部分均以此实施例中定义的坐标系为例进行说明。
[0043]本实施例中,SlOl具体可以下方式:对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
[0044]在S102中,按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系。
[0045]本实施例中,可以将第一坐标系进行合适的变换以最大限度地捕捉交通轨迹的特征,例如,可以将第一坐标系旋转一定的角度,形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系。
[0046]在S103中,在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0047]本实施例中,通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0048]在S104中,在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合。
[0049]在S105中,通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合。
[0050]在S106中,根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表
/Jn ο
[0051]为了便于理解,以下以一个具体的实现实例对本实施例中交通轨迹数据预处理的过程进行说明,但不以本实施例的情况为限,具体如下,仍然SlOl中所述的坐标系为例进行说明:
[0052]1、通过查询,可以获得经过任意两个位置之间的所有轨迹:对于一个起点(xs,ys)的查询,设置一个距离阈值ε,对于任何GPS坐标(X' s,y/ s),如果x' s e (xs- ε ,χ - ε)并且y' e (ys-e,ys-e),,并且,对于一个终点(Xd,yd)查询,设置一个距离阈值ε ',对于任何 GPS 坐标(X' d, y' d),如果 χ' de(Xd-e' Xd-ε ')并且 y' d e (yd-ε ',yd_e'),则把所有经过(X' s,y' s)和(X' A,y' d)的交通轨迹数据放入待处理列的交通轨迹数据列表中,记为D。
[0053]2、连接起点(xs,ys)和终点(xd,yd)间的线段,记为L,假设L与X轴之间的夹角为α,则将第一坐标系坐标轴向左旋转α-45°,形成新的坐标系S’,将交通轨迹数据列表D中的所有点转换成S’中的点,形成新的交通轨迹数据列表,记为D’。
[0054]3、通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0055]4、基于S’,在X轴的[xs,xd]范围内,取η个点,记为有序样本点集合X= {x1;.,χη},同样的方法,在Y轴的[ys,yd]上取m个点,记为有序样本点集合Y’ = {y' 1;...J ,X和Y’为采样获得的样本点集合,其中,m、n为自然数。
[0056]5、通过所述有序的线段集合,计算样本点集合X中的样本点Xi (Xi e Y)在Y轴上的映射,记为Y= Iy1,...,ym},其中,样本集合X的Xi与映射样本点集合Y中项yi对应。通过所述有序的线段集合,计算样本点集合Y’中的样本点y, y(y, teY')在X轴上的映射,记为Χ’={χ^ ,Xi J,其中,样本集合Y’中的项太i与映射样本点集合X’中项V i对应。
[0057]6、根据映射样本点集合Y和X’生成交通轨迹数据的向量表示为:Y-X'={ι?...,ym? χ --...? χ m}。
[0058]本实施例中,通过将交通轨迹数据所在的第一坐标系进行旋转至第二坐标系,并在第二坐标系中将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合,并在所述起点和终点在不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合,并通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合,根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。通过根据交通轨迹数据的走向特征,对交通轨迹数据进行规模规范化的预处理处理,实现对交通轨迹数据的正确、且快速的分类,处理过程的时间复杂度低,速度快,方便后续进行数据分析及数据挖掘。
[0059]实施例二·
[0060]图2示出了本发明实施例二提出的交通轨迹数据预处理系统的结构图,为了便于说明,仅示出了与本发明实施例相关的部分,该装置可以是内置于交通轨迹数据处理终端中的软件单元、硬件单元或者软硬结合单元。[0061]所述交通轨迹数据预处理系统包括:获取单元21、旋转单元22、转换单元23、采样单元24、计算单元25以及向量生成单元26。
[0062]获取单元21,用于获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系;
[0063]旋转单元22,用于按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系;
[0064]转换单元23,用于在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合;
[0065]采样单元24,用于在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;
[0066]计算单元25,用于通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合;
[0067]向量生成单元26,用于根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
[0068]可选的,所述获取单元21,具体用于对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
[0069]可选的,所述转换单元23,具体用于通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
[0070]可选的,所述第二坐标系的不同坐标轴为X轴和Y轴,所述采样单元24,具体用于在所述起点和终点在所述X轴的投影范围内,进行采样,获得X轴样本点集合X ;以及在所述起点和终点在所述Y轴的投影范围内,进行采样,获得Y轴样本点集合Y’。
[0071]所述计算单元24,具体用于通过所述有序的线段集合,计算所述样本点集合X在Y轴上的映射样本点集合Y ;以及计算所述样本点集合Y’在X轴上的映射样本点集合V。
[0072]本发明实施例提供的交通轨迹数据预处理系统可以使用在前述对应的方法实施例一中,详情参见上述实施例一的描述,在此不再赘述。
[0073]值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0074]另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如R0M/RAM、磁盘或光盘等。
[0075]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种交通轨迹数据预处理方法,其特征在于,所述方法包括: 获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系; 按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系; 在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合; 在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合; 通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合; 根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
2.如权利要求1所述的方法,其特征在于,所述获取任意起点和终点之间的待处理的交通轨迹数据具体为: 对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
3.如权利要求1所述的方法,其特征在于,在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合具体为: 通过连接每一交通轨迹 数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
4.如权利要求1所述的方法,其特征在于,所述第二坐标系的不同坐标轴为X轴和Y轴,所述在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合具体为: 在所述起点和终点在所述X轴的投影范围内,进行采样,获得X轴样本点集合X ;以及在所述起点和终点在所述Y轴的投影范围内,进行采样,获得Y轴样本点集合Y’。
5.如权利要求4所述的方法,其特征在于,所述通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合具体为: 通过所述有序的线段集合,计算所述样本点集合X在Y轴上的映射样本点集合Y ;以及计算所述样本点集合Y’在X轴上的映射样本点集合V。
6.一种交通轨迹数据预处理系统,其特征在于,所述系统包括: 获取单元,用于获取任意起点和终点之间的待处理的交通轨迹数据,其中,所述交通轨迹数据位于第一坐标系中,所述第一坐标系为二维坐标系; 旋转单元,用于按照预设角度,旋转所述第一坐标系形成第二坐标系,并将所述第一坐标系中所述交通轨迹数据投影至所述第二坐标系; 转换单元,用于在所述第二坐标系中,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合; 采样单元,用于在所述起点和终点在第二坐标系的不同坐标轴的投影范围内,分别进行采样,生成不同坐标轴对应的样本点集合;计算单元,用于通过所述有序的线段集合,计算每一坐标轴对应的样本点集合在另一坐标轴对应的映射样本点集合; 向量生成单元,用于根据不同坐标轴对应的映射样本点集合,生成交通轨迹数据的向量表示。
7.如权利要求6所述的系统,其特征在于,所述获取单元,具体用于对于原始的交通轨迹数据中的任意一条交通轨迹数据,如果通过了所述起点为中心的预设范围,且通过了所述终点为中心的预设范围,则所述交通轨数据为待处理的交通轨迹数据。
8.如权利要求6所述的系统,其特征在于,所述转换单元,具体用于通过连接每一交通轨迹数据中的相邻的GPS坐标点,将所述每一交通轨迹数据的GPS坐标点的集合转换为有序的线段集合。
9.如权利要求6所述的系统,其特征在于,所述第二坐标系的不同坐标轴为X轴和Y轴,采样单元,具体用于在所述起点和终点在所述X轴的投影范围内,进行采样,获得X轴样本点集合X ;以及在所述起点和终点在所述Y轴的投影范围内,进行采样,获得Y轴样本点鱼A V,:? 口 ? O
10.如权利要求9所述的系统,其特征在于,所述计算单元,具体用于通过所述有序的线段集合,计算所述样本点集合X在Y轴上的映射样本点集合Y ;以及计算所述样本点集合Y’在X轴上的映射样本点 集合V。
【文档编号】G06F19/00GK103853901SQ201210499095
【公开日】2014年6月11日 申请日期:2012年11月29日 优先权日:2012年11月29日
【发明者】邹瑜斌, 张帆, 李晔, 白雪, 须成忠 申请人:深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1