本发明涉一种识别方法,具体是一种基于手机加速度传感器的交通模式识别方法。
背景技术:
usagebasedinsurance(ubi),即基于使用以及驾驶行为的机动车辆保险,在国内正迎来快速发展期。ubi利用硬件或者手机获取车主的行驶数据,对车主的驾驶习惯、驾驶行为等数据进行分析,评估驾驶者的安全级别,对不同安全级别的车主给予不同的保费优惠,是一种差异化费率的汽车保险。ubi手机方案,不需要额外的硬件安装,通过手机内的传感器读取驾驶行为数据。
现有的手机ubi方案,或者由用户手动开启关闭手机的驾驶行为数据采集,或者判断用户在移动就开启数据采集,然后由用户手工标记行程的交通模式。该方案无法有效区分车主有效驾驶行为与乘坐其他的交通模式,同时用户可以将驾驶行为标记为非驾驶行为作弊,导致对用户的风险评估有误。
手机交通模式识别,即区分用户采用的步行、骑行、公交、地铁、驾车等不同交通模式,是ubi手机方案面临的一大挑战。
技术实现要素:
本发明的目的在于提供一种基于手机加速度传感器的交通模式识别方法以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于手机加速度传感器的交通模式识别方法,包含以下步骤:
a、使用手机加速度传感器采集加速度三轴原始数据;
b、加速度数据按固定时间滑动窗口(帧)切分,计算滑动窗口内特征(帧特征);
c、使用训练好的基于帧的决策树机器学习分类器区分用户是否步行阶段,若是标记步行,否标记为非步行,过滤掉步行行程;
d、对无步行段的行程数据,使用训练好的基于帧的决策树机器学习分类器区分用户是否处于静止状态,若是标记静止,否则标记非静止;
e、对非静止帧调用训练好的基于帧的决策树分类器区分用户的交通模式,标记单帧分类结果;
f、对行程数据计算整段特征,使用训练好的基于段的决策树分类器,获得整段分类结果;
g、集成步骤f中基于段的分类器结果与步骤e中基于帧的分类器的结果得到最终行程的标记判断。
作为本发明进一步的方案:所述步骤a中的手机加速度传感器为g-sensor。
与现有技术相比,本发明的有益效果是:本发明不仅可以精准区分各种交通模式,还与手机的位置无关,具有很高的准确性和实用性。交通模式识别,主要目标是通过手机采集完整行程的加速度传感器数据,区分用户乘坐的交通工具,为后续的数据分析与业务需求提供支持,如过滤不需要关注的地铁、公交行程,保留用户有效驾驶行程。
附图说明
图1是本发明的流程图。
图2是本发明的数据流程图。
图3为系统使用的三个分类器关系图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明实施例中,一种基于手机加速度传感器的交通模式识别方法,包含以下步骤:
a、使用手机加速度传感器采集加速度三轴原始数据;
b、加速度数据按固定时间滑动窗口(帧)切分,计算滑动窗口内特征(帧特征);
c、使用训练好的基于帧的决策树机器学习分类器区分用户是否步行阶段,若是标记步行,否标记为非步行,过滤掉步行行程;
d、对无步行段的行程数据,使用训练好的基于帧的决策树机器学习分类器区分用户是否处于静止状态,若是标记静止,否则标记非静止;
e、对非静止帧调用训练好的基于帧的决策树分类器区分用户的交通模式,标记单帧分类结果;
f、对行程数据计算整段特征,使用训练好的基于段的决策树分类器,获得整段分类结果;
g、集成步骤f中基于段的分类器结果与步骤e中基于帧的分类器的结果得到最终行程的标记判断。
步骤a中的手机加速度传感器为g-sensor。
本发明的工作原理是:1.数据采集,手机端采集加速度传感器(简称“g-sensor”)x,y,z三轴数据,该数据包含重力加速度的影响。计算三轴加速度数据的矢量模
2.滑动窗口设置,设置时间长度为t秒的滑动窗口,新旧窗口之间有t/2秒的数据重叠,每t/2秒更新计算滑动窗口中的数据,计算一次帧特征值。重叠滑动窗口保证快速跟踪交通工具运动特征的变化。
3.抽取帧特征,针对每个时间窗口,计算该时间窗口内的数据的特征描述该帧数据的状态。具体特征的计算见下表:
4.利用训练好的步行分类器判断该帧是否步行。如果连续采集的4帧中3帧为步行判断当前状态为步行,停止数据采集,否则继续执行步骤5。
5.使用训练好的静止分类器判断该帧是否静止,如果是静止,跳过该帧判断下一帧,如果不是静止,执行步骤6。
6.调用训练好的模式识别分类器获得该帧的分类结果与概率,记为{label,probabiliity},其中label为分类器输出的类别,probability为分为该类的概率或可信度,label∈{公交,地铁,骑行,私家车}。重复流程直到无数据输入,行程结束。记录整个行程的输出结果为
7.抽取段特征,根据5中获得的静止分类器结果计算基于段的特征,基于段的特征见表2包括:整段行程中静止的频率、时长、行程中加速度值的95分位数。使用训练好的基于段的模式识别分类器判断该行程分类结果与概率,记为probabilityl其中l∈{公交,地铁,骑行,私家车}。
8.基于6中获得的基于帧的结果