一种出租车绕路行为的识别方法与流程

文档序号:16326817发布日期:2018-12-19 05:58阅读:1478来源:国知局
一种出租车绕路行为的识别方法与流程
本发明涉及出租车运营管理
技术领域
,尤其涉及一种出租车绕路行为的识别方法。
背景技术
出租车作为一种不定时、不定点、不定线、充分满足乘客意愿的客运方式,以其方便、快捷、安全、舒适的特点,成为城市客运交通系统不可或缺的运输方式之一,是城市常规公共交通系统的重要组成部分。出租车规模的适度发展为缓解我国大城市的公交客运压力、丰富不同层次的客运需求、促进城市经济发展起到了积极作用。随着我国城市经济的日益繁荣和人民生活水平的逐步提高,出租车已从最初的高档消费发展成为公众出行选择的主要运输工具之一。21世纪以来,我国城市化进程加速,城市社会经济发展水平日益提高,导致交通需求不断增大,出租车既分担了相当一部分城市公交客流(一般约占25%~30%),又有效弥补了公交车通达性的不足,同时缓解和抑制了私人小汽车、单位通勤车发展过快的趋势,节省了城市道路、停车场等交通资源,对缓解国内城市普遍存在的交通需求与交通供给之间的矛盾大有裨益。由于社会和经济的发展,工作和生活节奏的加快,人们对时间价值和舒适程度的要求较之以往都大幅提高,一般城市公交提供的普适性大众化客运服务已明显不能满足这部分人群的出行要求,而出租车提供的较高标准的客运服务则可以充分地满足其需求。此外,随着我国改革开放事业的进一步发展,国际地位的不断提高以及旅游业的兴盛,来华洽谈商贸、参加政治、外交、文化活动和参观旅游者日益增多。出租车作为城市交通的窗口企业在为外地流动人口和国际友人的服务过程中发挥着重要作用,其服务质量的优劣和职业道德水平的高低从侧面反映了一个城市的社会风气和精神文化水平。然而,在出租车出行过程中有些出租车会出于各种目的绕路,造成乘客时间的浪费和财产的损失,严重违背了人们选择出租车的初衷,造成人们对出租车出行的不信任,破坏了一个城市的形象。因此,识别出租车绕路行为来减少该行为的发生具有重要意义。出租车绕路行为是指出租车从出发地到目的地不按正常路径走,而是兜圈子绕着走。随着城市建设的发展,以及出于避免拥堵或增大经济收益等目的,出租车绕路行为延续至今并日益突出。出租车绕路不仅浪费资源,造成乘客财产损失,而且可能浪费大量时间,给乘客带来不便与麻烦。技术实现要素:本发明的实施例提供了一种出租车绕路行为的识别方法,以解决以上问题。为了实现上述目的,本发明采取了如下技术方案。一种出租车绕路行为的识别方法,包括:通过出租车运营管理服务器存储和管理所有出租车的所有行驶数据,该行驶数据包括起点到终点od线路、开始行驶时间、行驶距离和行驶时长;获取待识别出租车在某条od线路上的实际的开始行驶时间、行驶距离和行驶时长,根据所述实际的开始行驶时间、行驶距离和行驶时长,以及所述出租车运营管理服务器中存储的所述某条od线路对应的所有行驶数据,采用绕路识别策略对所述出租车在某条od线路的行驶过程进行绕路行为识别。进一步地,所述的通过出租车运营管理服务器存储和管理所有出租车的所有行驶数据,该行驶数据包括od线路、开始行驶时间、行驶距离和行驶时长,包括:设置出租车运营管理服务器对所有出租车进行管理,所述出租车运营管理服务器对所有出租车在所有行驶时段的od线路的行驶数据进行采样,该行驶数据包括起点到终点od线路、开始行驶时间、行驶距离和行驶时长,确定所述开始行驶时间对应的出行时段,该出行时段包括:拥挤时段、普通时段和夜间时段,将获取的od线路、od线路所对应的行驶数据和行驶数据中开始行驶时间对应的时段分类关联存储到出租车管理数据库表中。进一步地,所述拥挤时段的行驶时间为:7:00-9:00和17:00-19:00;所述普通时段的行驶时间为:6:00-7:00、9:00-17:00和19:00-23:00;所述夜间时段的行驶时间为:23:00-6:00。进一步地,根据所述出租车在od线路实际的开始行驶时间、行驶距离和行驶时长,以及所述出租车运营管理服务器中存储的所述od线路对应的所有行驶数据,采用绕路识别策略对所述出租车的出行过程进行绕路行为识别,包括:根据所述待识别出租车的某条od线路查询所述出租车管理数据库表,获取所述某条od线路对应的所述实际的开始行驶时间处于相同出行时段的所有行驶数据,该行驶数据包括行驶距离和/或行驶时长,计算出所述所有行驶数据的中位数值x;计算需要判断的实际行驶数据xi与中位数值x的绝对偏差值|xi–x|,所述中位数值为通过把所有观察值高低排序后找出正中间的一个作为中位数;如果观察值有偶数个,取最中间的两个数值的平均数作为中位数;计算出绝对离差中位数mad=median{|xi-x|};计算出需要判断的实际行驶数据的改进z-score值:将所述改进z-score值mi与设定的阈值进行比较,根据比较结果对所述待识别出租车在某条od线路上的行驶过程进行绕路行为识别。进一步地,所述的将所述改进z-score值mi与设定的阈值进行比较,根据比较结果对所述待识别出租车在某条od线路上的行驶过程进行绕路行为识别,包括:当所述所有行驶数据的中位数值x包括所有行驶距离的中位数值时,将距离阈值设定为td,根据行驶距离数据计算得到的改进z-score值mi为md。当md>td时则认为所述待识别出租车在某条od线路上的行驶过程发生了绕行;当-td≤md≤td时则认为所述待识别出租车在某条od线路上的行驶过程是正常行驶;当md<-td时,则不对所述待识别出租车在某条od线路上的行驶过程进行绕路行为识别。进一步地,所述的将所述改进z-score值mi与设定的阈值进行比较,根据比较结果对所述待识别出租车在某条od线路上的行驶过程进行绕路行为识别,还包括:当所述所有行驶数据的中位数值还包括所有行驶时长的中位数值时,将时间阈值设定为tt,根据行驶时长数据计算得到的改进z-score值mi为mt;当md>td,-tt≤mt≤tt时则认为所述待识别出租车在某条od线路上的行驶过程发生了善意绕行;当md>td,mt>tt时则认为所述待识别出租车在某条od线路上的行驶过程发生了恶意绕行。进一步地,所述td=3.5,所述tt=3.5。进一步地,所述通过出租车运营管理服务器存储和管理所有出租车的所有行驶数据,该行驶数据包括起点到终点od线路、开始行驶时间、行驶距离和行驶时长,当获取的所述行驶数据为负值,所述的运营管理服务器将所述的数据删除,当实际的起点终点与od位置不符,所述的运营管理服务器将所述的数据删除。由上述本发明的实施例提供的技术方案可以看出,本发明实施例的出租车绕路行为的识别方法,通过利用出租车的开始行驶时间、行驶距离和行驶时长特性,采用改进z-score算法分时段来进行绕行识别策略的判断:当出租车的实际行驶距离通过改进z-score算法得到的值大于设定的阈值,则判定出租车的行为为绕路行为;当出租车在所述od段路的行为为绕路行为,并且当出租车在所述od段路的实际的行驶时长通过改进z-score算法得到的值小于或等于设定的阈值,则判定出租车在所述od段路的行为是善意绕行;当出租车在所述od段路的行为为绕路行为,并且当出租车在所述od段路的行驶时长通过改进z-score算法得到的值大于设定的阈值,识别系统则判定出租车的行为是恶意绕行。本方法原理简单,易于实现,可应用于发现大规模网络条件下的绕行,为道路交通管理者提供大量有用信息,为其管理与决策提供理论依据,最终帮助减少恶意绕行的行为发生,对构建绿色和谐的公共交通系统具有重要意义。本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的一种出租车绕路行为的识别方法的处理流程图;图2为本发明实施例提供的交通小区划分结果示意图;图3为本发明实施例提供的一对od平峰期出行的识别结果示意图;图4为成都市全网出行的识别结果分布图。具体实施方式下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本
技术领域
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本
技术领域
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。为便于对本发明实施例的理解,下面将结合附图以及具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。本发明实施例提供了一种出租车绕路行为的识别方法,旨在通过改进z-score算法来进行绕路识别策略的判断,该方法可以及时准确的识别出出租车的恶意绕行行为,对道路交通管理具有一定的指导意义。实施例一:该实施例提供的一种出租车绕路行为的识别方法的处理流程如图1所示,包括如下的处理流程:步骤s110、通过出租车运营管理服务器存储和管理所有出租车的所有行驶数据,该行驶数据包括起点到终点od线路、开始行驶时间、行驶距离和行驶时长。设置出租车运营管理服务器对所有出租车进行管理,所述出租车运营管理服务器对所有出租车在所有行驶时段的od线路的行驶数据进行采样,该行驶数据包括起点到终点od线路、开始行驶时间、行驶距离和行驶时长,确定所述开始行驶时间对应的出行时段,该出行时段包括:拥挤时段、普通时段和夜间时段,将获取的od线路、od线路所对应的行驶数据和行驶数据中开始行驶时间对应的时段分类关联存储到出租车管理数据库表中。示例性的,所述拥挤时段的行驶时间为:7:00-9:00和17:00-19:00;所述普通时段的行驶时间为:6:00-7:00、9:00-17:00和19:00-23:00;所述夜间时段的行驶时间为:23:00-6:00。本领域技术人员应能理解上述拥挤时段、普通时段和夜间时段的划分时段仅为举例,其他现有的或今后可能出现的拥挤时段、普通时段和夜间时段的划分时段如可适用于本发明实施例,也应包含在本发明保护范围以内,并在此以引用方式包含于此。通过出租车运营管理服务器存储和管理所有出租车的所有行驶数据,该行驶数据包括起点到终点od线路、开始行驶时间、行驶距离和行驶时长,当获取的所述行驶数据为负值,所述的运营管理服务器将所述的数据删除,当实际的起点终点与od位置不符,所述的运营管理服务器将所述的数据删除。通过出租车运营管理服务器存储和管理所有出租车的所有行驶数据,该行驶数据还可以包括出租车的车牌号、出租车的车主信息和出租车的性质。步骤s120、获取待识别出租车在某条od线路上的实际的开始行驶时间、行驶距离和行驶时长。步骤s130、根据所述实际的开始行驶时间、行驶距离和行驶时长,以及所述出租车运营管理服务器中存储的所述某条od线路对应的所有行驶数据,采用绕路识别策略对所述出租车在某条od线路的行驶过程进行绕路行为识别。根据所述待识别出租车的某条od线路查询所述出租车管理数据库表,获取所述某条od线路对应的所述实际的开始行驶时间处于相同出行时段的所有行驶数据,该行驶数据包括行驶距离和/或行驶时长,计算出所述所有行驶数据的中位数值x;计算需要判断的实际行驶数据xi与中位数值x的绝对偏差值|xi–x|,所述中位数值为通过把所有观察值高低排序后找出正中间的一个作为中位数;如果观察值有偶数个,取最中间的两个数值的平均数作为中位数;计算出绝对离差中位数mad=median{|xi-x|};计算出需要判断的实际行驶数据的改进z-score值:将所述改进z-score值mi与设定的阈值进行比较,根据比较结果对所述待识别出租车在某条od线路上的行驶过程进行绕路行为识别。当所述所有行驶数据的中位数值x包括所有行驶距离的中位数值时,将距离阈值设定为td,根据行驶距离数据计算得到的改进z-score值mi为md,当md>td时则认为所述待识别出租车在某条od线路上的行驶过程发生了绕行;当-td≤md≤td时则认为所述待识别出租车在某条od线路上的行驶过程是正常行驶;当md<-td时,则不对所述待识别出租车在某条od线路上的行驶过程进行绕路行为识别。当所述所有行驶数据的中位数值还包括所有行驶时长的中位数值时,将时间阈值设定为tt,根据行驶时长数据计算得到的改进z-score值mi为mt;当md>td,-tt≤mt≤tt时则认为所述待识别出租车在某条od线路上的行驶过程发生了善意绕行;当md>td,mt>tt时则认为所述待识别出租车在某条od线路上的行驶过程发生了恶意绕行。示例性的,所述td=3.5,所述tt=3.5。实施例二划分出行期间选取成都市连续14个工作日的出租车数据进行分析(2014年8月11日-2014年8月29日,8月13日除外,因数据有较大问题),研究范围限定为东经103.96度至东经104.19度、北纬30.58度至北纬30.78度。图2为一种交通小区划分结果示意图,如图2所示,首先使用arcgis软件将指定范围用渔网分割成2025个边长为500米的交通小区(一个格子代表一个交通小区),然后将所有出行记录的起终点经纬度匹配到对应的交通小区,最终获取每次出行的od(o为行驶起点,d为行驶终点)编号。此外,还要对错误的出行记录进行剔除,比如:行驶距离和行驶时长非正值的记录,以及起终点经纬度超出范围的记录等。最终得到用于验证的数据有7188982条。由于不同期间出行,交通状况不同,可能对出租车的绕行选择有一定影响,因此首先需要根据上车时间对出行时段进行划分。这里我们按照常识把出行期间划分为三类分别为普通时段;拥挤时段;以及夜间时段,表1为出行时段划分结果。表1出行时段划分结果出行时段出行时间拥挤时段7:00-9:00、17:00-19:00普通时段6:00-7:00、9:00-17:00、19:00-23:00夜间时段23:00-6:00识别不同性质的绕路行为正常行驶时,同一od同一出行时段的行驶距离和行驶时长会在一个范围内波动,在一定范围阈值之外的属于异常,通过绕路识别策略方法可以发现异常的行驶距离和行驶时长,进而帮助识别出租车绕路行为。本实施例采用改进z-score算法对全网不同od不同出行时段的行驶距离和行驶时长分别采用绕路识别策略来识别绕行,与传统z-score算法相比,它采用中位数和绝对离差中位数代替均值和标准差,可以避免极端异常点的影响,从而提高绕路识别的准确性。下面以同一od同一出行时段的出行记录为例对绕行识别策略进行说明。通过行驶距离进行识别来判断是否绕行正常行驶时,同一od同一出行期间的行驶距离会在一个范围内波动,若发生绕行,则行驶距离超出波动范围,因此釆用改进z-score算法对行驶距离进行绕路识别策略可以判别绕行,具体做法如下:①通过出租车管理数据库表中调取同一od线路同一出行时段的行驶距离;②计算同一od同一出行时段所有出行的行驶距离的中位数x;②计算每个行驶距离与中位数的绝对偏差值|xi–x|;③计算绝对离差中位数,即mad=median{|xi-x|};④计算每个行驶距离的改进z-score值,即当|mi|>3.5时,识别为异常值;⑤将行驶距离的mi即md值与距离的阈值td进行比较,优选地,td=3.5,即当md>3.5时则认为发生了绕行,当-3.5≤md≤3.5时则认为是正常行驶,当md<-3.5时,则行驶距离异常小,不属于本发明的研究内容,将给与舍弃,不进行识别。需要说明的是,中位数值为通过把所有观察值高低排序后找出正中间的一个作为中位数;如果观察值有偶数个,取最中间的两个数值的平均数作为中位数。对行驶时长进行识别来判断是何种性质的绕行采用以上步骤,可以根据行驶距离判别出绕行,接下来结合行驶时长判别绕行的性质,对行驶时长的识别方法同上。本发明定义了两种性质的绕路行为,即善意绕行和恶意绕行。善意绕行指的是出于避免拥堵等目的的绕路行为,此种绕行虽然行驶距离大于阈值,但行驶时长在阈值范围内;恶意绕行指出于增加经济收益等目的的绕路行为,这种绕路行为的行驶距离和行驶时长都大于阈值。当同一od同一出行期间行驶距离的md值大于阈值td,而行驶时长的mt值不大于阈值tt,优选地,tt=3.5,即md>3.5,-3.5≤mt≤3.5,则发生善意绕行,当同一od同一出行期间行驶距离md和行驶时长mt的值均大于阈值,即md>3.5,mt>3.5,则发生恶意绕行。实施例任选一对od平峰期出行的记录,对其行驶距离和行驶时长分别进行识别,图3为一对od平峰期出行的识别结果示意图,如图3所示,图3中(a)图为行驶距离识别后的结果展示(将行驶轨迹投放到成都市地图),对行驶距离进行识别可以判别是否绕行:识别为绕路的出行轨迹用黑点表示,识别为正常的用白点表示;图3中(b)图是把图(a)识别为绕行的轨迹单独提取出来,进一步对行驶时长进行识别来判断绕行性质的结果展示,恶意绕行用黑点表示,善意绕行用白点表示。对成都市全网不同od不同出行期间的行驶距离和行驶时长分别进行绕路识别策略判定,图4为成都市全网出行的识别结果分布图,如图4所示,可以得到全网正常行驶与善意绕行与恶意绕行的比例大概为44.3:1.9:1。本领域技术人员应能理解上述的应用类型仅为举例,其他现有的或今后可能出现的应用类型如可适用于本发明实施例,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解,上述所举的根据用户信息决定调用策略仅为更好地说明本发明实施例的技术方案,而非对本发明实施例作出的限定。任何根据用户属性来决定调用策略的方法,均包含在本发明实施例的范围内。综上所述,本发明将绕路识别策略方法应用到绕行问题中,采用改进z-score算法,利用发生的行驶距离和行驶时长特性来识别善意绕行和恶意绕行,并且考虑了交通状况的影响,将同一od的出行分时段进行识别,准确性高、原理简单并且易于实现,可应用于发现大规模网络条件下的绕行,为道路交通管理者提供大量有用信息,为其管理与决策提供理论依据,能有效的减少恶意绕行发生,对构建绿色和谐的公共交通系统具有重要作用。本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1