一种智能商业选址方法、装置及系统与流程

文档序号:11144000阅读:388来源:国知局
一种智能商业选址方法、装置及系统与制造工艺

本发明涉及通信技术领域,尤其涉及一种智能商业选址方法、装置及系统。



背景技术:

传统上用户一般采用人工方式进行商业选址,选址流程例如为:1)明确商业类型、选址条件;2)根据经验粗选部分目标区域(选址范围较大);3)人工调研目标区域内人群信息,地理设施信息,交通信息,进一步筛选目标区域,缩小选址范围;4)确定目标区域后,寻找目标区域内可租赁的店面;实地考察店面。这种传统的选址方式整个过程耗费大量人力成本和时间,而且人工调研得到的信息可能不准确,容易造成项目失败。

因此,目前出现了一些智能商业选址方案,其中一种智能商业选址方案为:构建包含大量地址的地址数据库和与该地址数据库有关联的商业信息数据库,并可对上述数据库中的数据进行归纳统计分析;用户可向系统输入欲查询的地址,得到与该地址关联的商业信息数据,这些数据例如为以图表形式输出查询结果或分析报告;之后用户可根据查询结果或分析报告确定是否在该地址选址。

本申请发明人在实际应用中发现,上述现有技术实际上是将大量人工采集的信息合成到统一的系统中供用户查询,其虽然合并了传统选址的部分步骤,但是前期的信息采集过程依旧是由人工进行的,仍然会耗费大量的人力成本和时间。并且由于人工采集的信息相对主观,可信度及准确性相对较低,因此可能导致对信息的分析结果不准确,进而导致用户的查询结果不准确,误导用户,甚至导致用户生意的失败。



技术实现要素:

本发明实施例提供一种智能商业选址方法、装置及系统,能够提高用户商业选址的精准性,并缩短选址过程的周期,降低人工成本。

为达到上述目的,本发明的实施例采用如下技术方案:

一种智能商业选址方法,包括:

获取目标区域的商业地理数据并从电信运营商处获取所述目标区域的用户信息数据;

将所述目标区域网格化划分为多个目标子区域;

利用所述商业地理数据以及用户信息数据计算每个目标子区域的推荐值;

根据每个目标子区域的推荐值向用户推荐目标子区域,使得用户根据推荐的目标子区域进行选址。

一种智能商业选址装置,包括:

获取单元,所述获取单元用于获取目标区域的商业地理数据并从电信运营商处获取所述目标区域的用户信息数据;

网格划分单元,所述网格划分单元用于将所述目标区域网格化划分为多个目标子区域;

计算单元,所述计算单元用于利用所述商业地理数据以及用户信息数据计算每个目标子区域的推荐值;

选址推荐单元,所述推荐选址单元用于根据所述计算单元计算出的每个目标子区域的推荐值向用户推荐目标子区域,使得用户根据推荐的目标子区域进行选址。

一种智能商业选址系统,包括如上所述的智能商业选址装置。

本发明提供的智能商业选址方法、装置及系统,通过从电信运营商处直接获取所述目标区域的用户信息数据,能够省去现有技术中通过人工调研来获取这类数据的人工成本,并大大缩短选址周期,同时避免了人工采集的数据可信度及准确性相对较低的缺陷。并且,本申请通过网格化划分的方式将大的目标区域细分为更小的目标子区域,之后计算每个目标子区域的推荐值,根据每个目标子区域的推荐值向用户推荐目标子区域,能够使得向用户推荐的选址地址更加精确。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的智能商业选址方法的流程图;

图2为本发明实施例一提供的智能商业选址方法的另一流程图;

图3本发明实施例二提供的智能商业选址装置的结构示意图;

图4为本发明实施例二提供的智能商业选址装置的另一结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

为了提高用户商业选址的精准性,并缩短选址过程的周期,降低人工成本,如图1所示,本发明实施例一提供的智能商业选址方法包括:

S1、获取目标区域的商业地理数据并从电信运营商处获取所述目标区域的用户信息数据。

其中,所述目标区域为用户期望的选址地点,如某个城市等。

其中,所述目标区域的商业地理数据包括地理化基础设施数据以及地理化商业数据。所述获取目标区域的商业地理数据包括:利用数据爬虫技术从地图上爬取地理化基础设施数据以及地理化商业数据。

本申请中的地理化基础设施数据的数据表结构如表1所示:

表1:

表1中的TYPE(基础设施类型)字段所包含的枚举值如表2所示:

表2:

本申请中的地理化商业数据的数据表结构如表3所示:

表3:

表3中TYPE(商铺大类)字段所包含的枚举值如表4所示:

表4:

其中,商铺子类SUB_TYPE指的是商铺大类下的具体商铺,比如表4中商铺大类“超市”下的商铺子类可以为沃尔玛、家乐福、华联等等。由于商铺子类SUB_TYPE枚举值较多,在此处不做一一列举。

如上所述,上述地理化基础设施数据以及地理化商业数据都可利用数据爬虫技术从地图上爬取,例如利用数据爬虫技术从高德地图开放平台爬取含有经纬度信息的基础设施数据。

需注意,本申请中对地理化基础设施数据以及地理化商业数据的获取方式不做限定,除了利用数据爬虫技术从高德地图开放平台爬取这些数据之外,还可以利用现有技术中的其他方式来获取这些数据,只要所获得的数据中包含本申请表1和表3中所列出的数据的全量信息即可。

其中,所述用户信息数据包括用户基础信息数据以及用户业务数据。所述从电信运营商处获取所述目标区域的用户信息数据包括:从电信运营商的业务运营支撑系统(Business&Operation Support System,BOSS)中获取所述目标区域的用户基础信息数据;从电信运营商移动网络Gn/S1-U接口获取所述目标区域的用户业务数据(例如,通过在移动网络核心网侧的Gn/S1-U接口进行挂表采集在网用户的业务数据,基于接口协议规范/业务类别解析规则进行数据解析,解析后生成结构化数据,通过与移动网络小区工参数据关联回填经纬度信息,生成所需用户业务数据)。

本申请中的用户基础信息数据的数据表结构如表5中所示:

表5:

本申请中的用户业务数据的数据表如表6所示:

表6:

表6中的SERVICE_CLASS(业务类别)的枚举值如表7所示:

表7:

S2、将所述目标区域网格化划分为多个目标子区域。

具体地,“网格化划分”是指以所述目标区域的中心点为基准,将所述目标区域划分为具有预设边长的多个正方形网格,其中每一个正方形网格为一个目标子区域。

需要注意,以下所述“网格”以及“目标子区域”都指目标子区域。

其中,预设边长可根据用户的选址需要进行设定,例如200米/500米/1000米。

本申请中对每个网格的边长是否一样不做限定。在实际应用中,可以将每个网格的边长都设为一样,例如每个网格的边长都是200米;或者划分出的网格可具有不一样的边长,例如某些网格的边长可为200米,而另外一些网格的边长为500米。

本申请中,为了分析商铺选址与各个影响因素之间的相关关系,需要将数据归属到统一的计算单元中进行量化计算,因此,在步骤S2中,将目标区域进行了划分,之后会将得到的每一个正方形的网格(即目标子区域)作为一个单元进行选址数据的计算及分析。

每个网格的相关数据如表8中所示,其中每个网格(即目标子区域)的位置由两对经纬度表示,其他4类数据(即地理化基础设施数据、地理化商业数据、用户基础信息数据以及用户业务数据)可以通过自身经纬度与网格经纬度进行关联,这样,就可得到每个网格的各类数据。

表8:

其中,每一个网格都有一个唯一标示GRID_ID,例如GRID_1、GRID_2、GRID_3等。

S3、利用所述商业地理数据以及用户信息数据计算每个目标子区域的推荐值。

在实际应用中,如图2所示,此步骤可包括步骤S31-S34:

S31、利用所述商业地理数据以及用户信息数据计算每个目标子区域中各影响因素对商业选址的影响值。

其中,所述影响因素包括人口集聚度、交通通达性、人口收入水平、商铺种类多样性、同类商铺聚集度;其中,所述人口集聚度的影响值用目标子区域的人口密度Paverage表示;所述交通通达性的影响值用目标子区域内的交通基础设施的数量Ntraffic表示;所述人口收入水平的影响值用目标子区域内的人口相对收入水平Vincome表示;所述商铺种类多样性用目标子区域内已有商铺大类的数量Ntype表示;所述同类商铺聚集度用目标子区域内同类商铺的密度Psub_type表示。

以下对Paverage、Ntraffic、Vincome、Ntype和Psub_type的具体计算方法进行描述:

Paverage

在实际应用中,目标子区域的人口密度Paverage可以为每个网格(即每个目标子区域)多天(例如一个星期或者10天或者一个月等)的人口密度的平均值。具体计算思路例如为:对于标示为GRID_1的网格,统计其一天内出现的去重人数N,使用N除以网格GRID_1的面积得到网格GRID_1当天的人口密度P,再根据最近一周(或者10天或者一个月等)的P,计算平均值,就得到网格GRID_1的人口密度Paverage。利用同样的方法就可计算出每个网格的人口密度。

Ntraffic

在实际应用中,目标子区域内的交通基础设施例如包括:地铁站、公交站、停车场。其中地铁站数量为Nsubway,公交站为Nbusstop,停车场为Nparking。综合三者,得到交通通达性的表达式Ntraffic=α×Nsubway+β×Nbusstop+γ×Nparking,其中,α、β、γ分别为三种交通基础设施(地铁站、公交站、停车场)所占的权重,在本申请中,三个权重的推荐值为α=0.5,β=0.2,γ=0.3。

Vincome

在实际应用中,目标子区域内的人口相对收入水平Vincome可由用户基础信息表(表5)中的月均消费值ARPU以及用户所持终端价格PHONEPRICE综合得到,具体地,Vincome=λ×ARPU+μ×PHONEPRICE。其中,λ、μ分别为月均消费值ARPU与用户所持终端价格PHONEPRICE权重,在本申请中,两个权重的推荐值为λ=0.8,μ=0.2。

Ntype

在实际应用中,目标子区域内已有商铺大类(表3中用TYPE表示)的枚举值如表4中所示,在表4中,目标子区域内已有商铺大类的数量Ntype=10。

Psub_type

在实际应用中,首先,统计网格内符合选址条件的商铺大类(表3中用TYPE表示)的商铺数量Ntype,然后,统计符合选址条件的商铺子类(表3中用SUB_TYPE表示)的商铺数量Nsub_type,最终得到同类商铺聚集度表达式Psub_type=Nsub_type/Ntype

也就是说,如果用户需要为服装店选址,则首先统计每个网格内的服装店(即商铺大类)的数量Ntype,然后统计服装店这一商铺大类下的具体的服装店的(即商铺子类)数量Nsub_type,然后利用同类商铺聚集度公式Psub_type=Nsub_type/Ntype计算出每个网格内服装店的聚集度。

需要注意的是,在步骤S31中计算出每个目标子区域中各影响因素对商业选址的影响值之后,由于上述计算算法选用的各指标具有不同的量纲,所以在做进一步分析之前对各个指标数据进行标准化处理,即将指标数值转换到某一指定的范围,例如[0,1]。

也就是说,在计算出每个网格的每个因素的影响值之后,需要对每个因素的影响值进行标准化。

因此,本发明的智能商业选址方法在步骤S31之后,所述方法还可包括:

S32、对计算出的每个目标子区域中各影响因素对商业选址的影响值进行标准化。

在实际应用中,可利用min-max数据标准化方法对计算出的每个目标子区域中各影响因素对商业选址的影响值进行标准化。

具体地,min-max数据标准化方法为:设minA和maxA分别是属性A原始值中的最小值和最大值,则将属性A的原始值v通过min-max标准化方法映射而来的v’为:

v’=(v-minA)/(maxA-minA) (等式1)

其中,min-max数据标准化方法中的“属性”即指本申请中的5个影响因素:人口集聚度、交通通达性、人口收入水平、商铺种类多样性、同类商铺聚集度。“属性”的值即影响因素的影响值,例如属性A的原始值v可以为人口集聚度的影响值Paverage。minA为所有网格中属性A的最小值,maxA为所有网格中属性A的最大值。v’即属性A的原始值v经过标准化之后的值。

下面以本申请的人口集聚度作为属性A为例,对步骤S31中计算出的人口集聚度的影响值的标准化进行说明。

首先计算出所有网格的人口集聚度的影响值。若要对网格GRID_1的人口集聚度的影响值进行标准化,则假设步骤S31中计算出的网格GRID_1的人口集聚度的影响值Paverage1=5(即原始值v=5),而所有网格中人口集聚度的影响值中的最小值为2(例如计算出的网格GRID_6的人口集聚度的影响值最小,即Paverage6=2,也即minA=2),所有网格中人口集聚度的影响值中的最大值为12(例如计算出的网格GRID_15的人口集聚度的影响值最大,即Paverage15=12,也即maxA=12),则网格GRID_1的人口集聚度经标准化后的值为:Paverage1’=(Paverage1-Paverage6)/(Paverage15-Paverage6)=(5-2)/(12-2)=0.3。之后利用同样的方法可以计算出每个网格的每个影响因素的影响值经过标准化之后的值。

经过标准化后的数据取值区间为[0,1],此方法将原始数据的相互关系保留了下来。

需要注意的是,虽然本申请上例中以min-max数据标准化方法对计算出的每个目标子区域中各影响因素对商业选址的影响值进行标准化,但是在实际应用中,还可以采用其他的标准化方法,本申请对此不做限定,只要经过标准化后的数据取值区间为[0,1],将原始数据的相互关系保留下来即可。

S33、计算每个目标子区域中各影响因素的权重因子。

在实际应用中,可利用灰色关联分析法来计算每个目标子区域中各影响因素的权重因子。灰色关联分析法无需知道变量之间的关系,可根据其时间序列曲线的相似程度来判断其关联程度的大小,若两条曲线的形状相似,关联度则越大,权重也就越大。

本发明可通过计算已有商铺子类SUB_TYPE的商铺数量Nsub_type与5个影响因素之间的相关关系来计算权重因子。具体计算方法如下:

假设参考因素数列为X,记为X={X1,X2,X3,…,Xk,…,Xn},其中n为网格数量,Xk等于第k个网格的Nsub_type

比较因素数列Y,每个Y分别表示一个影响因素数列,记为Yi={Yi1,Yi2,Yi3,…,Yik,…Yin},其中,在本申请中i表示影响因素,且i=1,2,3,…5。

此时,X和Yi的关联度为其中ri反映的是Yi对X的影响度。

在等式2中,ξ为分辨系数,一般在0~1之间,通常取0.5。△min为数列X(1行n列)与数列Yi(1行n列)相减之后所得到的数列(1行n列)中的最小值;为数列X(1行n列)与数列Yi(1行n列)相减之后所得到的数列(1行n列)中的最大值。

经过归一化处理,可求得因素Yi的权重(即影响因子)为:

利用灰色关联分析法计算出的人口集聚度、交通通达性、人口收入水平、商铺种类多样性、同类商铺聚集度这五个影响因素的权重因子例如可以分别为0.3、0.2、0.2、0.1、0.2。

需要注意的是,虽然本申请中上例用灰色关联分析法计算每个目标子区域中各影响因素的权重因子,但是在实际应用中,还可以采用其他的计算权重因子的方法,本申请对此不做限定,只要能计算出各影响因素的权重因子即可。

S34、根据标准化后的影响值以及计算出的权重因子计算每个目标子区域的推荐值。

此步骤实际上是根据5个影响因素(人口集聚度、交通通达性、人口收入水平、商铺种类多样性、同类商铺聚集度)的标准化数据以及对应的影响因子取值对每个网格(即目标子区域)进行综合打分。例如,通过线性相加的方式将各个因素进行融合,从而得出每个网格的最终的推荐值。推荐值计算公式如下:

其中,k代表每个网格的序号,wi为序号为i的影响因素的权重因子(即步骤S33中计算出的权重因子);Pki为在第k个网格中,影响因素i经过数据标准化之后的值(即步骤S31中的v’的值),此处的Pki的下标ki与步骤S33的等式2中Yik的下标ik指代相同的内容,即都是指第k个网格的第i个因素;Pk为求出的网格k的推荐值。

S4、根据每个目标子区域的推荐值向用户推荐目标子区域,使得用户根据推荐的目标子区域进行选址。

在实际应用中,此步骤可为:

将每个目标子区域的推荐值按从大到小的顺序进行排序;将排序后的目标子区域的列表推荐给用户,使得用户根据所述列表进行选址。

例如,可照推荐值从大到小的顺序将网格(目标子区域)推荐给用户。网格的推荐值越大,则越建议用户在此网格内进行选址。

由上可见,本发明实施例一提供的智能商业选址方法,通过从电信运营商处直接获取所述目标区域的用户信息数据,能够省去现有技术中通过人工调研来获取这类数据的人工成本,并大大缩短选址周期,同时避免了人工采集的数据可信度及准确性相对较低的缺陷。并且,本申请通过网格化划分的方式将大的目标区域细分为更小的目标子区域,之后计算每个目标子区域的推荐值,根据每个目标子区域的推荐值向用户推荐目标子区域,能够使得向用户推荐的选址地址更加精确。

实施例二

如图3所示,本发明实施例二提供了一种智能商业选址装置20,包括:获取单元21,所述获取单元21用于获取目标区域的商业地理数据并从电信运营商处获取所述目标区域的用户信息数据;网格划分单元22,所述网格划分单元用于将所述目标区域网格化划分为多个目标子区域;计算单元23,所述计算单元23用于利用所述获取单元获取的商业地理数据以及用户信息数据计算每个目标子区域的推荐值;选址推荐单元24,所述推荐选址单元24用于根据所述计算单元23计算出的每个目标子区域的推荐值向用户推荐目标子区域,使得用户根据推荐的目标子区域进行选址。

其中,所述获取单元21获取的目标区域的商业地理数据包括地理化基础设施数据以及地理化商业数据,所述用户信息数据包括用户基础信息数据以及用户业务数据。此时,所述获取单元21具体用于:利用数据爬虫技术从地图上爬取地理化基础设施数据以及地理化商业数据,从电信运营商的业务运营支撑系统BOSS中获取所述目标区域的用户基础信息数据;从电信运营商移动网络Gn/S1-U接口获取所述目标区域的用户业务数据。

其中,所述网格划分单元22具体用于:以所述目标区域的中心点为基准,将所述目标区域划分为具有预设边长的多个正方形网格,其中每一个正方形网格为一个目标子区域。

其中,如图4所示,所述计算单元23包括:第一计算子单元231,所述第一计算子单元231用于利用所述商业地理数据以及用户信息数据计算每个目标子区域中各影响因素对商业选址的影响值;数据标准化子单元232,所述数据标准化子单元用于对所述第一计算子单元231计算出的每个目标子区域中各影响因素对商业选址的影响值进行标准化;第二计算子单元233,所述第二计算子单元233用于计算每个目标子区域中各影响因素的权重因子;第三计算子单元234,所述第三计算子单元234用于根据所述数据标准化子单元232标准化后的影响值以及所述第二计算子单元233计算出的权重因子计算每个目标子区域的推荐值。

所述影响因素包括人口集聚度、交通通达性、人口收入水平、商铺种类多样性、同类商铺聚集度;其中,所述人口集聚度的影响值用目标子区域的人口密度Paverage表示;所述交通通达性的影响值用目标子区域内的交通基础设施的数量Ntraffic表示;所述人口收入水平的影响值用目标子区域内的人口相对收入水平Vincome表示;所述商铺种类多样性用目标子区域内已有商铺大类的数量Ntype表示;所述同类商铺聚集度用目标子区域内同类商铺的密度Psub_type表示。

上述Paverage、Ntraffic、Vincome、Ntype、Psub_type的计算方法可参照前面方法实施例中的描述,在此不再赘述。

所述数据标准化子单元232具体可用于利用min-max数据标准化方法对所述第一计算子单元231计算出的每个目标子区域中各影响因素对商业选址的影响值进行标准化。

所述第二计算子单元233具体可利用灰色关联分析法计算每个目标子区域中各影响因素的权重因子。

其中,所述选址推荐单元24具体用于:将所述计算单元23计算出的每个目标子区域的推荐值按从大到小的顺序进行排序;将排序后的目标子区域的列表推荐给用户,使得用户根据所述列表进行选址。

上述装置的工作原理可参照前述方法实施例中的描述,在此不再赘述。

由上可见,本发明实施例二提供的智能商业选址装置,通过从电信运营商处直接获取所述目标区域的用户信息数据,能够省去现有技术中通过人工调研来获取这类数据的人工成本,并大大缩短选址周期,同时避免了人工采集的数据可信度及准确性相对较低的缺陷。并且,本申请通过网格化划分的方式将大的目标区域细分为更小的目标子区域,之后计算每个目标子区域的推荐值,根据每个目标子区域的推荐值向用户推荐目标子区域,能够使得向用户推荐的选址地址更加精确。

此外,本发明实施例还提供了一种智能商业选址系统,该系统包括如上所述的智能商业选址装置20。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。

需说明的是,以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1