一种地理围栏的生成方法和设备与流程

文档序号:11845689阅读:237来源:国知局
一种地理围栏的生成方法和设备与流程

本申请涉及网络技术领域,特别是涉及一种地理围栏的生成方法和设备。



背景技术:

地理围栏技术是基于位置的服务(Location Based Service,LBS)的一种新应用,是用一个虚拟的栅栏围出一个虚拟地理边界的技术,现已可以应用于位置区域监控、区域商业群落、需求群地图、区域信息服务等方面的系统,为诸多信息系统提供地理位置服务信息。

在现有地理围栏的生成技术中,主要使用平面圆模型,即用平面圆表示围栏,圆心表示围栏的中心位置,半径表示围栏的大小。但是平面圆模型在实际情况中存在多种不足:第一,围栏的中心位置和围栏的大小需要人工测量,线下人工成本高;第二,限于人工成本高,所能覆盖的围栏量很小;第三,现实中围栏都是不规则的多边形,用圆来表示小区的边界是不准确的。



技术实现要素:

本申请的目的在于提供一种地理围栏的生成方法和设备,可以自动生成地理围栏,使地理围栏的形状更加接近实际实体的形状,提高实体的覆盖率,同时还降低人工成本。

本申请的技术方案如下:

本申请提供一种地理围栏的生成方法,包括:

服务器根据用户的基于位置服务LBS信息,以及实体与所述用户的关系信息,确定所述实体对应的LBS信息;

所述服务器根据确定的所述实体对应的LBS信息,生成所述实体的地理围栏。

所述服务器根据用户LBS信息,以及实体与所述用户的关系信息,确定 所述实体对应的LBS信息,包括:

所述服务器根据用户的LBS信息,以及所述实体与所述用户的关系信息,确定所述实体与LBS信息的映射关系;

所述服务器根据确定出的所述实体与LBS信息的映射关系,确定所述实体对应的LBS信息。

所述服务器根据所述实体与LBS信息的映射关系,确定所述实体对应的LBS信息,包括:

所述服务器根据所述实体与LBS信息的映射关系,确定所述实体所对应的用户群的LBS信息;

所述服务器根据所述实体的使用属性,对所述实体所对应的用户群的LBS信息进行过滤,确定出所述实体对应的LBS信息。

所述服务器根据确定的所述实体对应的LBS信息,生成所述实体的地理围栏,包括:

所述服务器对确定出的所述实体对应的LBS信息进行聚类生成LBS簇;

所述服务器根据所述LBS簇生成所述实体的地理围栏。

所述服务器根据所述LBS簇生成所述实体的地理围栏,具体为:

所述服务器确定出所述LBS簇的密度;

所述服务器将密度大于阈值的所述LBS簇确定为所述实体的高密度LBS簇;

所述服务器根据所述高密度LBS簇生成所述实体的地理围栏。

所述服务器根据所述高密度LBS簇生成所述实体的地理围栏,具体为:

所述服务器将任意两个中心距离小于阈值的所述高密度LBS簇进行融合;

所述服务器确定出融合后包含LBS信息最多的LBS簇;

所述服务器根据融合后包含LBS信息最多的LBS簇生成所述实体的地理围栏。

一种地理围栏的生成设备,其特征在于,所述设备包括:

确定模块,用于根据用户的LBS信息,以及实体与所述用户的关系信息, 确定所述实体对应的LBS信息;

生成模块,用于根据确定的所述实体对应的LBS信息,生成所述实体的地理围栏。

所述确定模块,包括:

第一确定子模块,用于根据用户的LBS信息,以及所述实体与所述用户的关系信息,确定所述实体与LBS信息的映射关系;

第二确定子模块,用于根据确定出的所述实体与LBS信息的映射关系,确定所述实体对应的LBS信息。

所述第二确定子模块,具体用于:

所述第二确定子模块根据所述实体与LBS信息的映射关系,确定所述实体所对应的用户群的LBS信息;

所述第二确定子模块根据所述实体的使用属性,对所述实体所对应的用户群的LBS信息进行过滤,确定出所述实体对应的LBS信息。

所述生成模块,包括:

聚类子模块,用于对确定出的所述实体对应的LBS信息进行聚类生成LBS簇;

生成子模块,用于根据所述LBS簇生成所述实体的地理围栏。

所述生成子模块,具体用于:

所述生成子模块确定出所述LBS簇的密度;

所述生成子模块将密度大于阈值的所述LBS簇确定为所述实体的高密度LBS簇;

所述生成子模块根据所述高密度LBS簇生成所述实体的地理围栏。

所述生成子模块根据所述高密度LBS簇生成所述实体的地理围栏,具体为:

所述生成子模块将任意两个中心距离小于阈值的所述高密度LBS簇进行融合;

所述生成子模块确定出融合后包含LBS信息最多的LBS簇;

所述生成子模块根据融合后包含LBS信息最多的LBS簇生成所述实体的 地理围栏。

本申请中基于用户的LBS信息,以及实体与用户的关系确定出所述实体对应的LBS信息,由于确定出的LBS信息经过筛选后的LBS信息,因此确出的LBS信息能够表示所述实体的,然后所述服务器通过确定出的所述实体对应的LBS信息确定出所述实体的地理围栏,本申请利用用户的LBS信息自动化地生成地理围栏,可以使得得到的地理围栏的形状更加接近实际实体的形状,而且提高了实体的覆盖率,同时还降低人工成本。

附图说明

为了更清楚地说明本申请或现有技术中的技术方案,下面将对本申请或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例中的一种地理围栏的生成方法流程图;

图2为本申请实施例中一种基于用户LBS信息生成实体的地理围栏的方法流程图;

图3为本申请实施例中一种实体类别与LBS信息时间维度的对应关系图;

图4为本申请实施例中一种高密度LBS簇生成流程图;

图5为本申请实施例中一种基于分布式计算机平台的地理围栏生成示意图;

图6为本申请实施例中一种地理围栏的生成设备的结构示意图。

具体实施方式

下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的其他实施例,都属于本申请保护的范围。

随着地理围栏技术的应用价值越来越大,能够获取海量的用户地址和LBS(Location Based Service,基于位置的服务)信息,这使得构建地理围栏 具备了数据基础。本申请中利用能够获取的海量用户地址和LBS信息,来自动生成地理围栏,可较少人工成本,且地理围栏的形状更加接近实际实体的形状。

如图1所示,为本申请实施例中的一种地理围栏的生成方法,其特征在于,所述方法包括以下步骤:

步骤101,服务器根据用户的基于位置服务LBS信息,以及实体与所述用户的关系信息,确定所述实体对应的LBS信息。

具体的,用户的地址信息是电子商务公司沉淀的用户在购物时填写的收货地址信息,或,通过其他途径能够获取用户的地址信息的方法。实体的地址信息一般是从垂直的专业网站或专门的机构获得的,如:地图数据提供商等。将所述用户的地址信息与所述实体的地址信息进行匹配就能够得到实体与所述用户的关系信息,例如:从快递公司可以获取用户的地址信息,从地图数据供应商可以获取实体的地址信息,当所述用户的地址信息包含所述实体的地址信息时,如:用户的地址为:北京市西城区宣武门外大街28号B座101室,实体的地址信息为:北京市西城区宣武门外大街28号,表明所述用户的地址信息包含所述实体的地址信息能够匹配的上,就能得到实体与所述用户的关系信息,如:所述用户在所述实体内工作。

所述服务器根据用户的基于位置服务LBS信息,以及实体与所述用户的关系信息,确定所述实体对应的LBS信息,具体为:

所述服务器根据用户的LBS信息,以及所述实体与所述用户的关系信息,确定所述实体与LBS信息的映射关系;

所述服务器根据确定出的所述实体与LBS信息的映射关系,确定所述实体对应的LBS信息。

具体的,所述服务器可以根据所述用户的地址信息和实体的地址信息确定出所述用户属于哪个实体,在根据用户的LBS信息就能够确定所述实体与LBS信息的映射关系。

所述服务器根据所述实体与LBS信息的映射关系,确定所述实体对应的LBS信息,包括:

所述服务器根据所述实体与LBS信息的映射关系,确定所述实体所对应的用户群的LBS信息;

所述服务器根据所述实体的使用属性,对所述实体所对应的用户群的LBS信息进行过滤,确定出所述实体对应的LBS信息。

具体的,当某些用户的地址信息集中在一起时,且这些用户的地址信息都属于一个实体时,这些用户就可以称为一个用户群,服务器根据用户群的LBS信息可以确定出那些用户群属于所述实体。

所述服务器根据所述实体的使用用途上的差异、使用时间上的差异、使用方法上的差异等所述实体与其他实体存在使用上的差异,来确定出所述实体在某些属性上所独有的LBS信息,确定出的LBS信息就是相对于所述实体的LBS信息,即所述使用属性可以为使用用途、使用时间和使用方法等。例如:某大厦是一个写字楼,其用途是为人们日常工作提供场所,其一般的使用时间是工作日的早上9点到下午5点,根据这些信息确定出哪些LBS信息是在工作日的早上9点到下午5点确定出属于该大厦的LBS信息,而这些LBS信息组合起来就能基本代表该大厦的大概LBS信息;或者,在某棋牌室中只有一个棋牌桌,其用途是为人们日常娱乐的,只有固定个数的LBS信息出现时才能确定出代表所述棋牌室的LBS信息;或者,确定某段地铁隧道的地理围栏,只有在一些LBS信息消失后,并再次出现,此过程循环若干次后才能确定出该段地铁隧道的地理围栏。当然还可以根据实体的多个使用属性确定所述实体所独有的LBS信息。

其中,所述LBS信息中包含了用户所使用的终端的标识ID(IDentity,身份标识号码)、经度信息、纬度信息和采集时间等信息。

步骤102,所述服务器根据确定的所述实体对应的LBS信息,生成所述实体的地理围栏。

所述服务器根据确定的所述实体对应的LBS信息,生成所述实体的地理围栏,具体为:

所述服务器对确定出的所述实体对应的LBS信息进行聚类生成LBS簇;

所述服务器根据所述LBS簇生成所述实体的地理围栏。

所述服务器根据所述LBS簇生成所述实体的地理围栏,具体为:

所述服务器确定出所述LBS簇的密度;

所述服务器将密度大于阈值的所述LBS簇确定为所述实体的高密度LBS簇;

所述服务器根据所述高密度LBS簇生成所述实体的地理围栏。

所述服务器根据所述高密度LBS簇生成所述实体的地理围栏,具体为:

所述服务器将任意两个中心距离小于阈值的所述高密度LBS簇进行融合;

所述服务器确定出融合后包含LBS信息最多的LBS簇;

所述服务器根据融合后包含LBS信息最多的LBS簇生成所述实体的地理围栏。

本申请中基于用户的LBS信息,以及实体与用户的关系确定出所述实体对应的LBS信息,由于确定出的LBS信息经过筛选后的LBS信息,因此确出的LBS信息能够表示所述实体的,然后所述服务器通过确定出的所述实体对应的LBS信息确定出所述实体的地理围栏,本申请利用用户的LBS信息自动化地生成地理围栏,可以使得得到的地理围栏的形状更加接近实际实体的形状,而且提高了实体的覆盖率,同时还降低人工成本。

为了进一步阐述本申请的技术思想,现结合具体的应用场景,对本申请的技术方案进行说明。

具体的,如图2所述,利用基于用户收货地址信息和实体信息构建的实体用户关系信息,以及用户的LBS信息,找到待确定实体所对应的用户群体的LBS信息。用户收货地址信息是电子商务公司沉淀的用户在购物时填写的收货地址信息。实体信息一般是从垂直的专业网站或专门的机构获得的。收货地址与实体信息之间的匹配采用的是搜索技术和文本匹配技术。

在已知每个实体对应哪些用户的基础上,结合这些用户的LBS信息,就可以进行LBS信息到实体的关系映射。LBS信息到实体映射的目的是解决实体计算中实体无LBS信息的问题,主要是通过用户这一维度将用户的LBS信息传递给用户所对应的实体。用户-实体关系信息中包含了每个实体对应的用 户群的信息,比如一个小区的住户人群,同时,用户群中的部分用户是具有LBS信息的,这些LBS信息包含了用户在对应实体下的LBS信息,所以通过将用户的LBS信息传递给对应的实体来获取包含实体LBS信息的冗余LBS信息集。

由于单个用户的所有LBS信息是该用户在所有活动地域的位置记录,所以需要通过LBS信息时间规格化,从原始LBS信息里筛选出与每个实体的性质相对应的部分LBS信息。

例如:LBS信息时间规格化从时间维度上根据实体类别(如:日常用途)对一个实体的部分冗余LBS进行过滤。在规格化过程中,实体被分为三类:工作场所、家和休闲场所。实体类别与LBS信息时间维度的对应关系如图3所示。

LBS信息从时间维度首先被分为两个维度,工作日和非工作日,两个时间维度下又按小时各被切分成24段。LBS信息时间规格化就是根据表1的对应关系,对于某一实体的LBS信息集进行筛选,只保留这个集合中时间特征与实体类别相匹配的LBS信息,如:一个小区实体,它的LBS信息只会保留时间特征与家庭类别相匹配部分。

如图4所示,为了能够更加准确的确定出实用性更高的LBS信息,在时间规格化后的LBS信息上还存在噪声,不能直接在这些LBS信息上直接计算围栏,利用DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)算法对LBS信息进行聚类,那么原始的LBS信息就转化为一个个的LBS簇,此时就会将所述实体中的用户所对应的LBS信息进行了划分,表示所述LBS簇中的用户在某些方面具有相同的特性。。又因为一个实体对应用户群出现在这个实体位置上是大概率事件,所以用高密度的LBS簇就来描述这个实体的位置,此时,就会将实体相对应的LBS信息中游离的LBS信息去除掉,即保证高密度LBS簇中不会因为个别用户的偶然事件或小概率事件对最后生成的地理围栏造成影响,而所述高密度LBS簇是大多数用户经常活动的位置或大概率事件,因此用确定出的高密度LBS簇得出的地理围栏更加准确。

LBS簇信息包括两项:簇中心点坐标和簇密度。其中,簇中心点坐标是簇中所有用户经纬度点经纬度的算术平均值,簇密度是该簇内所有用户经纬度点的数量与实体经纬度点总数量的商。假设有一个LBS簇为C,则C的信息用公式表示如下: <mrow> <msub> <mi>Lat</mi> <mi>c</mi> </msub> <mo>=</mo> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>Lat</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>/</mo> <mi>n</mi> <mo>,</mo> <msub> <mi>Lon</mi> <mi>c</mi> </msub> <mo>=</mo> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>Lon</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>/</mo> <mi>n</mi> <mo>,</mo> <msub> <mi>d</mi> <mi>c</mi> </msub> <mo>=</mo> <mi>n</mi> <mo>/</mo> <mi>N</mi> <mo>,</mo> </mrow>其中,n为C内经纬度点的数量,Latc表示簇中心点的纬度值,Lonc表示簇中心点的经度值,Lati表示簇内第i个点的纬度值,Loni表示簇内第i个点的经度值,dc表示C的密度,N表示C所属实体包含的总经纬度点数量。

在一个实体下,密度大于等于一定阈值的LBS簇被认为是该实体的高密度LBS簇,高密度LBS簇中去除了偶尔出现或小概率事件所对应的LBS信息。

由于一个实体覆盖的空间范围比较广,所以要对距离比较近的高密度LBS簇进行融合。融合策略为,对于一个实体对应的高密度LBS簇,其中任意两个簇的中心点距离小于一定阈值的,就认为这两个簇可以融合,最后将所有能够融合的簇都进行合并得到融合后的LBS簇,挑选LBS信息最多的的簇作为该实体的LBS表示。在该LBS表示上运用GiftWrapping算法得到该实体的地理围栏,此时得到的地理围栏与实际实体的形状、大小、位置的相似都是很高的。

如图5所示,本申请可以应用在分布式计算平台上的实施方案。主要运用Hive SQL(Hive Structured Query Language,结构化查询语言数据仓库工具)和映射化简Map Reduce程序实现和部署,每一个环节都是分布式计算平台上实现。

本申请中基于用户的LBS信息,以及实体与用户的关系确定出所述实体对应的LBS信息,由于确定出的LBS信息经过筛选后的LBS信息,因此确出的LBS信息能够表示所述实体的,然后所述服务器通过确定出的所述实体对应的LBS信息确定出所述实体的地理围栏,本申请利用用户的LBS信息自动化地生成地理围栏,可以使得得到的地理围栏的形状更加接近实际实体的形状,而且提高了实体的覆盖率,同时还降低人工成本。

基于与上述方法同样的申请构思,本申请还提出了一种地理围栏的生成 设备,如图6所述,该设备包括:

确定模块61,用于根据用户的LBS信息,以及实体与所述用户的关系信息,确定所述实体对应的LBS信息;

生成模块62,用于根据确定的所述实体对应的LBS信息,生成所述实体的地理围栏。

所述确定模块,包括:

第一确定子模块,用于根据用户的LBS信息,以及所述实体与所述用户的关系信息,确定所述实体与LBS信息的映射关系;

第二确定子模块,用于根据确定出的所述实体与LBS信息的映射关系,确定所述实体对应的LBS信息。

所述第二确定子模块,具体用于:

所述第二确定子模块根据所述实体与LBS信息的映射关系,确定所述实体所对应的用户群的LBS信息;

所述第二确定子模块根据所述实体的使用属性,对所述实体所对应的用户群的LBS信息进行过滤,确定出所述实体对应的LBS信息。

所述生成模块,包括:

聚类子模块,用于对确定出的所述实体对应的LBS信息进行聚类生成LBS簇;

生成子模块,用于根据所述LBS簇生成所述实体的地理围栏。

所述生成子模块,具体用于:

所述生成子模块确定出所述LBS簇的密度;

所述生成子模块将密度大于阈值的所述LBS簇确定为所述实体的高密度LBS簇;

所述生成子模块根据所述高密度LBS簇生成所述实体的地理围栏。

所述生成子模块根据所述高密度LBS簇生成所述实体的地理围栏,具体为:

所述生成子模块将任意两个中心距离小于阈值的所述高密度LBS簇进行融合;

所述生成子模块确定出融合后包含LBS信息最多的LBS簇;

所述生成子模块根据融合后包含LBS信息最多的LBS簇生成所述实体的地理围栏。

本申请中基于用户的LBS信息,以及实体与用户的关系确定出所述实体对应的LBS信息,由于确定出的LBS信息经过筛选后的LBS信息,因此确出的LBS信息能够表示所述实体的,然后所述服务器通过确定出的所述实体对应的LBS信息确定出所述实体的地理围栏,本申请利用用户的LBS信息自动化地生成地理围栏,可以使得得到的地理围栏的形状更加接近实际实体的形状,而且提高了实体的覆盖率,同时还降低人工成本。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本申请的保护范围。

本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以集成于一体,也可以分离部署;可以合并为一个模块,也可以进一步拆分成多个子模块。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

以上公开的仅为本申请的几个具体实施例,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1