一种超出经营范围的出租车GPS轨迹数据的提取方法与流程

文档序号:16430069发布日期:2018-12-28 20:04阅读:883来源:国知局
一种超出经营范围的出租车GPS轨迹数据的提取方法与流程

本发明涉及信息技术领域,尤其涉及一种超出经营范围的出租车gps轨迹数据的提取方法。

背景技术

随着我国交通运输的不断发展,乘坐出租车出行已成为人们不可或缺的一种出行方式。出租车数量呈现飞速增长的态势,与此同时出现了很多出租车超范围经营的问题,如何判断出租车是否在规定的区域内营运,加强对出租车的管理至关重要。本发明人在实施本发明的过程中发现,现有技术中存在以下技术问题:现有技术利用单数据节点简单提取出来的出租车经营轨迹gps数据,只能用于出租车经营轨迹回放,未能有效判断出租车是否超越经营范围,还需要根据人工经验判断出租车经营范围,同时每月的数据量在百万级以上,传统的数据处理方式无法快速有效的对海量的数据进行处理和存储。



技术实现要素:

本发明实施例提供一种超出经营范围的出租车gps轨迹数据的提取方法能快速有效的处理和储存海量的出租车数据,并能自动计算匹配得出超越经营范围的出租车gps轨迹数据,从而判断出租车是否超范围经营,无需根据人工经验判断出租车是否超范围经营。

一种超出经营范围的出租车gps轨迹数据的提取方法,包括:

通过数据库水平分区技术将出租车经营表分割为若干个出租车经营分区表,将出租车gps轨迹表分割为若干个出租车gps轨迹分区表。

检索出出租车经营分区表中的出租车经营数据,并将出租车经营数据和预先选定市区的电子围栏数据进行比对,将超出电子围栏数据的经纬度范围的出租车经营数据,作为异常出租车经营数据。

将出租车gps轨迹分区表与异常出租车经营数据中车牌号相同的出租车gps轨迹数据提取,作为超出选定市区经营范围的出租车gps轨迹数据。

进一步的,通过数据库水平分区技术将出租车经营表、出租车gps轨迹表进行水平分区,分割为多个出租车经营分区表和多个出租车gps轨迹分区表,具体为:

将出租车经营表按月进行水平分区,分割为每月一个表,得到若干个出租车经营分区表,将出租车gps轨迹表按日进行水平分区,分割为每日一个表,得到若干个出租车gps轨迹分区表。

进一步的,检索出出租车经营分区表中的出租车经营数据,具体为:

执行定义一个定时任务的计算机操作,按预设的频率自动检索当前月份的出租车经营分区表中的数据,按数据生成时间排序,获得出租车经营数据。

进一步的,将出租车经营数据和预先选定市区的电子围栏数据进行比对,将超出电子围栏数据的经纬度范围的出租车经营数据,作为异常出租车经营数据,具体为:

选定市区的电子围栏数据存储到分布式缓存队列a,出租车经营数据存储到分布式缓存队列b中。

执行启用多个出租车有效经营范围计算服务的计算机操作,每个服务从分布式缓存队列b中取出所述出租车经营数据,再从分布式缓存队列a中取出电子围栏数据,将出租车经营数据中的开始计价的经纬度、结束计价的经纬度与电子围栏的经纬度进行比对,将开始计价的经纬度和结束计价的经纬度都没有在电子围栏的经纬度范围内的出租车经营数据,作为异常出租车经营数据存放在分布式缓存队列c中。

进一步的,将出租车gps轨迹分区表与所述异常出租车经营数据中车牌号相同的出租车gps轨迹数据提取,作为超出选定市区经营范围的出租车gps轨迹数据,具体为:

执行启用多个出租车gps轨迹数据提取服务的计算机操作,每个服务从分布式缓存队列c中取出异常出租车经营数据,通过异常出租车经营数据中的开始打表时间和结束打表时间的日期,在对应日期的出租车gps轨迹分区表中匹配相同车牌号的出租车gps轨迹数据,得到超出经营范围的出租车gps轨迹数据。

进一步的,所执行计算操作是通过hadoop技术实现的。

本发明实施例提供的一种超出经营范围的出租车gps轨迹数据的提取方法,具有如下有益效果:通过数据库水平分区和分布式存储技术对出租车经营数据和出租车gps数据进行数据分区和储存,解决了如何对海量的数据进行快速有效的处理和储存的问题,同时利用hadoop技术对出租车经营数据、选定的各市区电子围栏、出租车经营gps轨迹数据进行计算处理,筛选出超范围经营的出租车gps轨迹数据。

附图说明

图1是本发明实施例提供的一种超出经营范围的出租车gps轨迹数据的提取方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,是本发明实施例提供的一种超出经营范围的出租车gps轨迹数据的提取方法的流程示意图,包括:

s101:通过数据库水平分区技术将出租车经营表分割为若干个出租车经营分区表,将出租车gps轨迹表分割为若干个出租车gps轨迹分区表,具体为:

将出租车经营表按月进行水平分区,分割为每月一个表,得到若干个出租车经营分区表,将出租车gps轨迹表按日进行水平分区,分割为每日一个表,得到若干个出租车gps轨迹分区表。

s102:检索出出租车经营分区表中的出租车经营数据,并将出租车经营数据和预先选定市区的电子围栏数据进行比对,将超出电子围栏数据的经纬度范围的出租车经营数据,作为异常出租车经营数据,具体为:执行定义一个定时任务的计算机操作,按预设的频率自动检索当前月份的出租车经营分区表中的数据,按数据生成时间排序,获取出租车经营数据,然后将选定市区的电子围栏数据存储到分布式缓存队列a,将出租车经营数据存储到分布式缓存队列b中。

执行启用多个出租车有效经营范围计算服务的计算机操作,每个服务从分布式缓存队列b中取出出租车经营数据,再从分布式缓存队列a中取出电子围栏数据,将出租车经营数据中的开始计价的经纬度、结束计价的经纬度与电子围栏的经纬度进行比对,将开始计价的经纬度和结束计价的经纬度都没有在电子围栏的经纬度范围内的出租车经营数据,作为异常出租车经营数据存放在分布式缓存队列c中。

s103:将出租车gps轨迹分区表与异常出租车经营数据中车牌号相同的出租车gps轨迹数据提取,作为超出选定市区经营范围的出租车gps轨迹数据,具体为:

执行启用多个出租车gps轨迹数据提取服务的计算机操作,每个服务从分布式缓存队列c中取出异常出租车经营数据,通过异常出租车经营数据中的开始打表时间和结束打表时间的日期,在对应日期的出租车gps轨迹分区表中匹配相同车牌号的出租车gps轨迹数据,得到超出经营范围的出租车gps轨迹数据。

为了更好地说明本发明方法的实施流程,以下对本发明的方法进行具体的描述:

以在佛山市内营运的出租车为选定的出租车对象,取佛山市区域范围的经纬度数据作为选定市区的电子围栏数据,储存在分布式缓存队列a中。

通过数据库水平分区技术,将佛山市内营运出租车的出租车经营数据表按年月进行分区,分割为每月一个表,将其出租车gps轨迹表按天进行分区,分割为每天一个表。

通过hadoop技术,在计算机中执行以下操作:

定义一个定时任务“job”按每5分钟一次的频率自动检索当月出租车经营表中的出租车经营数据,按照数据生成的时间排序取出最新的出租车经营数据,储存在分布式缓存队列b中。

启用多个出租车有效经营范围计算服务,每个服务根据队列先进先出的特性,顺序从分布式缓存队列b中取出出租车经营数据,同时取出存放在分布式缓存队a中佛山市电子围栏数据,比对出租车经营数据中的出租车开始计价和结束计价的经纬度和佛山市电子围栏数据中的区域范围的经纬度,若出租车开始计价的经纬度和结束计价的经纬度,都没有落在佛山市的经纬度范围内,则判断该车辆超范围经营,将该出租车的经营数据取出,作为异常出租车经营数据,储存在分布式缓存队列c中。

启用多个出租车gps轨迹数据提取服务,每个服务从缓存队列c中取出异常出租车经营数据,接着在对应日期的出租车gps轨迹分区表中查找与异常出租车经营数据中的车牌号相同的出租车gps轨迹数据,并取出另存为有效证据关系表中。

将以上计算结果的提取出的超出经营范围的出租车gps轨迹数据保存在关系型数据库中,完成整个计算和数据匹配的过程。

通过实施本发明实施例能够利用数据库水平分区和分布式存储技术对出租车经营数据和出租车gps数据进行数据分区和储存,解决了如何对海量的数据进行快速有效的处理和储存的问题,同时利用hadoop技术对出租车经营数据、选定的各市区电子围栏、出租车经营gps轨迹数据进行计算处理,计算匹配得出超范围经营的出租车gps轨迹数据,无需再依据人工经验对出租车是否超范围经营进行判断。

需说明的是,以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1