一种基于基站定位大数据提取热点的方法与流程

文档序号:14392264阅读:1343来源:国知局

本发明涉及大数据提取技术领域,具体为一种基于基站定位大数据提取热点的方法。



背景技术:

定位系统(以确定空间位置为目标而构成的相互关联的一个集合体或装置(部件))一般指全球定位系统。简单地说,这是一个由覆盖全球的24颗卫星组成的卫星系统。这个系统可以保证在任意时刻,地球上任意一点都可以同时观测到4颗卫星,以保证卫星可以采集到该观测点的经纬度和高度,以便实现导航、定位、授时等功能。

gps定位技术具有高精度、高效率和低成本的优点,使其在各类大地测量控制网的加强改造和建立以及在公路工程测量和大型构造物的变形测量中得到了较为广泛的应用。gps导航仪简单地说,gps导航仪就是能够帮助用户准确定位当前位置,并且根据既定的目的地计算行程,通过地图显示和语音提示两种方式引导用户行至目的地的汽车驾驶辅助设备。

很多情况下,跟货设备在密封的环境下没有gps信号,只能使用基站定位;物流机构的站点目前多数以人为标定为主,效率低下;目前的热点分析处理一般是基于gps定位处理,而基站定位相对于gps定位有极大的不准确性,基站定位的热点分析处理很不完善。



技术实现要素:

本发明的目的在于提供一种基于基站定位大数据提取热点的方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种基于基站定位大数据提取热点的方法,包括以下步骤:

a、原始数据清洗;

b、获取初级热点数据:根据处理后的位置数据,参考轨迹车辆数、停留时长、车次数,设定阈值,获取初级热点数据;

c、获取公共热点库、公共站点库:

a、整合初级热点数据,去重整合,增量存入公共热点库;

b、对公共热点库加入爬取的站点数据干预,得到公共站点库;

c、公共站点库生成唯一id字段和事件触发半径;

d、热点库更新策略:

a、每日分析新的位置数据,增量添加初级热点数据,增量生成公共热点库;

b、对公共站点库全量更新;

c、同步热点库数据到业务库,以供事件处理、站点查询等业务需求使用。

优选的,所述步骤c中事件触发半径包括事件触发的半径生成算法和唯一id生成算法,其中事件触发的半径生成算法为:根据基站库数据集,获取各个热点临近的基站,取附近3个基站最远的一个作为事件触发半径;唯一id生成算法为:对geohash字符串和维度进行md5处理,生成32字符串,即为id。

与现有技术相比,本发明的有益效果是:本发明基于spark对原始数据清洗、整合,根据数据特征设计并应用热点提取算法得到初级热点数据,并对初级数据再处理,再将整个数据处理模型配置每日调度,将每日的增量数据进行上述步骤处理后增量入库,行程热点库和站点库;本发明产生的热点库可以作为站点自动化识别、物流车辆事件实时推送、物流地图绘制等物流需求的基础数据;此外,可部分替代人工标注站点,极大节省人力,提高效率。

附图说明

图1为本发明流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供一种技术方案:一种基于基站定位大数据提取热点的方法,包括以下步骤:

a、原始数据清洗;

b、获取初级热点数据:根据处理后的位置数据,参考轨迹车辆数、停留时长、车次数,设定阈值,获取初级热点数据;

c、获取公共热点库、公共站点库:

a、整合初级热点数据,去重整合,增量存入公共热点库;

b、对公共热点库加入爬取的站点数据干预,得到公共站点库;

c、公共站点库生成唯一id字段和事件触发半径;

d、热点库更新策略:

a、每日分析新的位置数据,增量添加初级热点数据,增量生成公共热点库;

b、对公共站点库全量更新;

c、同步热点库数据到业务库,以供事件处理、站点查询等业务需求使用。

本发明中,所述步骤c中事件触发半径包括事件触发的半径生成算法和唯一id生成算法,其中事件触发的半径生成算法为:根据基站库数据集,获取各个热点临近的基站,取附近3个基站最远的一个作为事件触发半径;唯一id生成算法为:对geohash字符串和维度进行md5处理,生成32字符串,即为id。

本发明基于spark对原始数据清洗、整合,根据数据特征设计并应用热点提取算法得到初级热点数据,并对初级数据再处理,再将整个数据处理模型配置每日调度,将每日的增量数据进行上述步骤处理后增量入库,行程热点库和站点库;本发明产生的热点库可以作为站点自动化识别、物流车辆事件实时推送、物流地图绘制等物流需求的基础数据;此外,可部分替代人工标注站点,极大节省人力,提高效率。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。



技术特征:

技术总结
本发明公开了一种基于基站定位大数据提取热点的方法,基于spark对原始数据清洗、整合,根据数据特征设计并应用热点提取算法得到初级热点数据,并对初级数据再处理,再将整个数据处理模型配置每日调度,将每日的增量数据进行上述步骤处理后增量入库,行程热点库和站点库;本发明产生的热点库可以作为站点自动化识别、物流车辆事件实时推送、物流地图绘制等物流需求的基础数据;此外,可部分替代人工标注站点,极大节省人力,提高效率。

技术研发人员:周贤伟;岳兴;肖志明;岳旸;娄伟峰
受保护的技术使用者:吉旗(成都)科技有限公司
技术研发日:2017.11.23
技术公布日:2018.05.08
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1