一种基于GPS速度信息的交通方式识别方法与流程

文档序号:21090242发布日期:2020-06-12 17:10阅读:310来源:国知局
一种基于GPS速度信息的交通方式识别方法与流程

本发明涉及出行调查技术领域,具体而言,涉及一种基于gps速度信息的交通方式识别方法。



背景技术:

交通出行方式是居民出行特征及出行行为研究的基本属性。交通方式的识别研究对于出行规律研究、精准化交通信息服务及交通运行状态判别等具有现实意义。传统交通方式识别的研究方法是利用居民出行行为抽样调查,但是存在抽样率较低、实施成本较高及实施时间间隔较长等问题。随着智能手机的普及应用及移动互联网技术的迅速发展,具有覆盖范围广、采集成本低等特点的智能手机gps数据逐渐成为智能交通信息采集技术新的手段。大量的、准确的智能手机gps数据将为精准化、精细化的居民出行行为分析及城市交通状况感知提供重要数据支撑。

目前利用手机gps识别交通方式的方法涉及两方面技术:

一方面是数据源的选择及融合技术,主要利用gps数据与其他辅助数据源进行融合,如gis系统的整合、加速度信息的融合等。利用多类型数据融合方法进行交通方法识别虽然可以取得较高识别精度,但是需要较多线下计算,并不适合实时的利用手机gps定位信息进行交通方式判别。而目前直接从gps数据中定位信息、速度信息及加速度信息作为数据源的方法中,由于加速度属性的检测对于智能手机的硬件配置具有特定要求,且加速度由三轴加速度传感器检测,难以排除手机使用或携带过程中自身的晃动或翻转导致的误差影响。且既有方法对步行、非机动车及机动车的识别精度比较有效,而对小汽车及公交车的识别精度并不理想。

另一方面是交通方式识别的建模技术,目前主要采用机器学习方法,如神经网络、模糊逻辑理论、支持向量机、决策树等,上述建模技术在建模数据量及应用环境适应性等方面仍然存在一定的局限。支持向量机方法在低样本量及非线性逼近方面具有许多优势,但是选择核函数过于依赖专家经验,缺乏自学习能力。神经网络方法虽然能够识别交通参数中隐含的非线性特征,可适应大量的历史数据的离线训练,但网络的组织结构固定,推广能力差。

综上所述,既有的利用手机gps数据识别交通方式的方法在识别精度、识别类型及实用性方面,与精准化、精细化的交通出行行为分析及实时交通状态判别的应用要求存在一定差距。



技术实现要素:

本发明的目的在于提供一种基于gps速度信息的交通方式识别方法,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:

本申请实施例提供了一种基于gps速度信息的交通方式识别方法,所述方法包括:

采集建模时刻之前的特定时段内多条出行链数据,所述出行链数据包括:第一瞬时速度和第一交通方式;

用每个出行链数据中的第一瞬时速度,计算该出行链数据采集时段的第一平均速度和第一速度方差;

将建模数据集中每条出行链数据中的第一瞬时速度、第一平均速度和第一速度方差三个特征变量作为输入值,第一交通方式作为输出值训练anfis模型;

采集拟识别时刻之前的预定时段内的多个第二瞬时速度,计算出预定时间段内的第二平均速度和第二速度方差;

将第二瞬时速度、第二平均速度和第二速度方差输入训练好的anfis模型,该模型输出的第二交通方式即为拟识别时刻的交通方式。

可选地,所述方法还包括:

将采集到的出行链数据分成两组,两组数据的名称分别记为建模数据集和测试数据集;

所述训练anfis模型时,用建模数据集中的第一瞬时速度、第一平均速度和第一速度方差作为输入值,建模数据集中的第一交通方式作为输出值;

所述anfis模型训练完成后,将测试数据集中的第一瞬时速度、第一平均速度和第一速度方差作为输入值,输入训练后的anfis模型中,将anfis模型输出的第三交通方式与测试数据集中的第一交通方式进行对比,判断第三交通方式是否正确,并计算出所述anfis模型的识别准确率。

可选地,将采集到的出行链数据分成建模数据集和测试数据集的分配方式为平均分配。

可选地,所述出行链数据还包括:经度、纬度、定位经度、卫星数量。

可选地,所述方法还包括:

设置出行链数据的阈值范围,将异常数据进行剔除;所述每种交通方式对应一个瞬时速度的阈值范围。

可选地,所述方法还包括:

将所述第一瞬时速度、第一平均速度和第一速度方差做归一化处理;

将所述第二瞬时速度、第二平均速度和第二速度方差做归一化处理。

可选地,所述归一化公式为:

公式(1)中,xi为归一化后的值。

可选地,所述anfis模型训练时,用网格分割法进行takagi-sugeno型anfis模型训练。

本发明具有以下有益效果:

本发明通过连续检测手机gps数据中的速度信息,并利用自适应模糊神经推理系统实现对小汽车、公交及步行三种交通方式进行自动识别。

本发明通过实时采集、分析gps手机定位的数据,将普通用户的手机移动终端作为一种有效的交通检测器。无需在手机终端上安装任何特殊设备、无需安装任何软件,可以节约大量基础设施投资。本发明克服了当前交通信息采集方式所存在的样本量覆盖范围较小、专业采集设备依赖较强、成本高等不足等问题。本发明能够明确地对交通参与者的交通方式进行识别,较为准确地识别出小汽车、公交车及步行的交通方式,使得交通数据更为可靠,有效,指导性更强。可以为城市交通运输管理提供有效的检测和监控手段。

本发明选择anfis作为交通方式的识别模型,该模型是神经网络及模糊逻辑的有机结合,不但可以自动生成模糊规则,而且还可以使模型具有明确的输入输出关系的表达能力。在实际应用中理论上具有自学习能力、收敛速度快、运算方便等优点,适用于内置于手机中进行在线实时计算。

本发明所选择的瞬时速度、平均速度和速度方差三个变量作为输入变量,这三个变量可通过手机gps数据中直接获取及计算,且具备区分小汽车、地面公交车和步行的运行特征的能力。

本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例的中所述的基于gps速度信息的交通方式识别方法流程示意图;

图2是本发明实施例中所述的第二瞬时速度分布示意图;

图3是本发明实施例中所述的第二平均速度分布示意图;

图4是本发明实施例中所述的第二速度方差分布示意图;

图5是本发明实施例中所述的模型预测值与实际值对比示意图;

图6是本发明实施例中所述的基于异常数据剔除后建模的交通工具为小汽车的识别精度对比示意图;

图7是本发明实施例中所述的基于异常数据剔除后建模的交通工具为公交车的识别精度对比示意图;

图8是本发明实施例中所述的基于异常数据剔除后建模的交通工具为步行的识别精度对比示意图;

图9是本发明实施例中所述的基于异常数据剔除后建模的平均识别精度对比示意图;

图10是本发明实施例中所述的基于未剔除异常数据建模的平均识别精度对比示意图;

图11是本发明实施例中所述的阈值范围示意图;

图12是本发明实施例中所述的数据量统计示意图;

图13是本发明实施例中所述的建模后测试数据集中交通方式识别结果示意图;

图14是本发明实施例中所述的三种模型的性能对比示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

本实施例提供了一种基于gps速度信息的交通方式识别方法,如图1所示,所述方法包括训练anfis模型和交通方式识别两个部分,其中,训练anfis模型部分包括步骤s10、步骤s20和步骤s30,交通方式识别部分包括步骤s40和步骤s50。

步骤s10:采集建模时刻之前的特定时段内多条出行链数据,所述出行链数据包括:第一瞬时速度和第一交通方式。

所述特定时段可根据需要进行调整,当然,为了使模型的准确率达到理想的90%以上。所述特定时段大于或等于10000秒,所述出行链数据的条数大于或等于2000条。

利用在安卓平台上的gps轨迹记录软件及出行日志记录软件,可记录智能手机用户的gps轨迹信息及实际交通方式信息。所示gps轨迹信息的采集频率为5秒,每条记录包含数据为:出行日期、出行时间、瞬时速度、经度、纬度、定位精度、卫星数量和方位角等。所示实际交通方式信息包括出行起止时间及相应的实际交通方式,所述实际交通方式可以由日志记录软件自动记录或志愿者手动录入,所述实际交通方式包括:小汽车、公交车和步行。通过出行志愿者的实际出行,在不影响出行计划的前提下,收集采集志愿者的出行信息,结束后导出gps数据并与实际出行交通方式合并整理。小汽车、公交车和步行分别用数值1、2、3表示。

步骤s20:用每个出行链数据中的第一瞬时速度,计算该出行链数据采集时段的第一平均速度和第一速度方差。

第一瞬时速度每5秒采集一次,将上一次采集第一瞬时速度的时刻和该次采集第一瞬时速度的时刻之间的时段记为一个采集区间,计算每个采集区间中的第一平均速度和第一速度方差。

步骤s30:将建模数据集中每条出行链数据中的第一瞬时速度、第一平均速度和第一速度方差三个特征变量作为输入值,第一交通方式作为输出值训练anfis模型。

用所述第一瞬时速度、第一平均速度和第一速度方差这三个特征变量训练anfis模型的依据是:在概率分布图上,不同交通方式对应的三个特征变量的波峰位置及大小均具有明显差异。

将第一瞬时速度、第一平均速度和第一速度方差三种特征变量作为输入,实际交通方式作为输出,利用matlab软件及网格分割法进行takagi-sugeno型anfis训练。经过反复调试,得到瞬时速度包含4个高斯隶属度函数。经过30次迭代后,学习过程可收敛,均方根误差为0.1622。

步骤s40:采集拟识别时刻之前的预定时段内的多个第二瞬时速度,计算出预定时间段内的第二平均速度和第二速度方差。

所述预定时段为拟识别时刻之前的2分钟,每5秒采集一次第二瞬时速度,则总共采集到的第二瞬时速度为24个,即共24个采集区间。通过采集到的每一个第二瞬时速度计算出每个采集区间内的第二平均速度和第二速度方差。

如图2、图3和图4所示,三种交通方式在三个参数的概率分布图的波峰位置及大小均具有明显差异。以图3为例,公交车及步行均在横坐标5处出现峰值,但公交车峰值(62%)高于步行峰值(46%)。而小汽车在横坐标15处出现峰值48%。因此,可认为选择的三种属性对于交通方式具有较明显的区分度,可作为模型的特征变量进行建模。

步骤s50:将第二瞬时速度、第二平均速度和第二速度方差输入训练好的anfis模型,该模型输出的第二交通方式即为拟识别时刻的交通方式。

可选地,所述出行链数据还可以包括:经度、纬度、定位经度、卫星数量。所示步骤s10和步骤s20之间,还可以包括步骤s11。

步骤s11:设置出行链数据的阈值范围,将异常数据进行剔除;所述每种交通方式对应一个瞬时速度的阈值范围。

为了提高模型构建质量,采用阀值法对存在明显不合理的数据进行筛选,清除明显异常及空白数据。如图11所示,不同的交通方式,其瞬时速度的区间不同,对不属于图11范围的数据予以删除。

可选地,所述步骤s10和步骤s20之间还可以包括步骤s12,所示步骤s30还可以包括步骤s31和步骤s32。

步骤s12:将采集到的出行链数据分成两组,两组数据的名称分别记为建模数据集和测试数据集;将采集到的出行链数据分成建模数据集和测试数据集的分配方式为平均分配。

步骤s31:所述训练anfis模型时,用建模数据集中的第一瞬时速度、第一平均速度和第一速度方差作为输入值,建模数据集中的第一交通方式作为输出值;

步骤s32:所述anfis模型训练完成后,将测试数据集中的第一瞬时速度、第一平均速度和第一速度方差作为输入值,输入训练后的anfis模型中,将anfis模型输出的第三交通方式与测试数据集中的第一交通方式进行对比,判断第三交通方式是否正确,并计算出所述anfis模型的识别准确率。

将测试数据集输入训练好的模型,对测试数据集的交通方式属性值进行预测。交通方式属性值的实际值及模型预测值如图5所示。由图5观察可知,模型预测值与实际值具有非常强的对应特征。将模型预测值进行四舍五入取整处理,并与实际值对比,若两者相同则认为交通方式推断正确。统计各交通方式推断矩阵结果如图13所示,行列交叉处表示实际出行方式(列)识别成预测出行方式(行)的样本个数,可得模型预测的平均准确率为95%。

可选地,所述步骤s20和步骤s30之间还包括步骤s21,所述步骤s40和步骤s50之间,还包括步骤s41。

步骤s21:将所述第一瞬时速度、第一平均速度和第一速度方差做归一化处理。

步骤s41:将所述第二瞬时速度、第二平均速度和第二速度方差做归一化处理。

所述归一化公式为:

公式(1)中,xi为归一化后的值。

为了验证anfis与其他方法的性能差异,选择目前对同类问题常用的支持向量机(supportvectormachines,svm)及决策树(decisiontree,dt)方法进行对比。模型性能对比采用以下三项标准:

(1)准确性:正确预测新样本交通方式能力;

(2)强壮性:对于有噪声或具有缺失值样本的正确预测能力。

(3)伸缩性:对于给定不同规模的建模数据集,能有效构造模型并准确预测的能力。

分别将测试数据集及建模数据集随机抽取分成10份,每次抽取比例分别为10%、20%,…,100%,从而将两种样本数据集各分成10份新的建模数据集,测试数据集保持不变。对三种方法分别用新的建模数据集构建模型,并用测试数据集检验预测的准确性。

svm采用libsvm环境,选择常用的径向基函数为核函数,并用十折交叉检验法进行模型训练。dt采用c4.5算法及十折交叉检验法进行模型训练。

1、基于异常数据剔除后的模型精度对比。

剔除异常数据代表了不含噪声或缺失等异常的数据类型,三种模型在不同预处理数据量的各交通方式识别精度及平均识别精度见图6、图7、图8和图9所示(横坐标为样本量(条),纵坐标为识别精度(%))。由图6至图9观察可知,在预测的准确性方面,dt能达到的平均识别精度最低(低于90%)。anfis及svm能达到的平均识别精度大致相同,均大于90%。在伸缩性方面,三种模型在样本量大于1000条时,平均识别精度均可达到最大且趋于稳定,但dt对步行识别精度的稳定性低于anfis及svm。因此可认为svm及anfis伸缩性大致相同,且高于dt。

2、基于原始数据的模型精度对比。

原始数据代表了包含噪声或缺失等异常的数据类型,三种模型在不同原始数据量的识别平均精度如图10所示。当样本量大于2000时,anfis的平均识别精度最高,可达到90%,而svm及dt均低于85%,可认为anfis强壮性最高。当样本量大于1000时,dt平均识别精度比svm更稳定,且普遍大于svm,可认为dt强壮性高于svm。

3、模型性能综合对比。

综合分析上述结论,三种模型的性能优劣对比结果总结如图14所示,可认为anfis的综合性能最高。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1