一种耦合多源要素的数字标牌位置推荐方法与流程

文档序号：16089425发布日期：2018-11-27 22:50阅读：来源：国知局

技术特征：

1.一种耦合多源要素的数字标牌位置推荐方法，通过构建数字标牌位置推荐模型实现耦合多源要素的数字标牌位置推荐，包括步骤：要素处理、区域划分、位置推荐、模型验证；具体过程包括：

1)要素选取及处理：构造空间化的数字标牌区位因子，包括但不限于人口普查要素、交通要素、房价要素、社交网络签到要素、经济普查要素，得到数字标牌区位因子的标准格网栅格图层，包括像素值及对应的坐标值；执行如下操作：

11)筛选出数字标牌区位因子；

12)对数字标牌区位因子进行空间化处理，得到数字标牌区位因子规则格网栅格数据；

13)对数字标牌区位因子进行归一化处理；

2)区域划分：利用多种空间聚类算法对步骤13)归一化处理的数字标牌区位因子进行区域划分，通过聚类评价标准比较不同聚类方法，利用最大信息系数测算得到每个分区各数字标牌区位因子的最优比例关系；执行如下操作：

21)利用多种空间聚类算法对数字标牌区位因子数据进行区域划分；

22)利用聚类评价标准来比较不同的聚类方法，得到对分析数据进行聚类达到最佳聚类的空间聚类算法；

23)用最大信息系数定义影响数字标牌区位因子因素对数字标牌分布的影响程度，进而通过最大信息系数计算，得到每个分区各数字标牌区位因子的最优比例关系；

其中，最大信息系数定义为：

式1中,B(n)为网格划分x×y的上限值；M(D)x,y为特征矩阵；

得到的MIC(D)值代表数字标牌区位因子在区域D中的权重，表示为B，Bi＝{Bi1,Bi2,…,Bin},i＝1,2,3,…n；Bi表示第i个地块中的数字标牌区位因子权重，Bin表示第i个区域中第n个数字标牌区位因子权重；

对于已经划分好的区域中数字标牌区位因子作为样本A，Ai＝{Ai1,Ai2,…Ain}，i＝1,2,3,…n；Ai表示第i个地块的数字标牌区位因子样本，Ain表示第i个地块中第n个数字标牌区位因子；

将数字标牌区位因子向量A和其数字标牌区位因子权重B求乘积：A×B，作为推荐算法的数据源；

3)进行数字标牌位置推荐；执行如下操作：

31)利用核密度分析法计算数字标牌样本点在周围邻域中的密度，得到数字标牌样本点的核密度值；

32)利用欧氏距离计算已布设数字标牌样本点与未布设数字标牌样本点之间的相似性；

33)从已布设数字标牌中选出与未布设数字标牌相似性最高的前n个样本点；将n个样本点的相似性与其核密度值加权求平均，为每个未布设数字标牌的地块计算得到一个在0-1之间的分数，该分数表示该地块适合布设数字标牌的程度；

4)验证模型的有效性，由此通过构建数字标牌位置推荐模型实现耦合多源要素的数字标牌位置推荐。

2.如权利要求1所述耦合多源要素的数字标牌位置推荐方法，其特征是，所述数字标牌区位因子包括：城市常住人口数目、城市期末从业人口数目、城市交通网络中心性指数、城市建筑物平均房价、社交网络公众签到数量。

3.如权利要求1所述耦合多源要素的数字标牌位置推荐方法，其特征是，步骤12)对数字标牌区位因子进行空间化处理，具体地，将选取的数字标牌区位因子经过预处理，删除部分异常数据；经过地理编码匹配、投影转换和数据纠偏，得到数字标牌区位因子空间数据；再通过空间连接操作，将数字标牌区位因子空间数据按照面积权重赋值到500米规则格网中，并将矢量数据转换成栅格数据，由此得到500m数字标牌区位因子规则格网栅格数据；

步骤13)对数字标牌区位因子进行归一化处理，具体采用最小最大值标准化方法进行归一化处理，通过式2的最小-最大规范化对原始数据进行线性变换：

式2中，max为样本最大值，min为样本最小值；×为原始样本点数据；×^*为将经过归一化后的样本点数据。

4.如权利要求1所述耦合多源要素的数字标牌位置推荐方法，其特征是，步骤2)区域划分选取的多种空间聚类算法包括：K-MEANS聚类算法、BIRCH聚类算法、DBSCAN聚类算法和SOM聚类算法；采用的聚类评价标准为Calinski-Harabaz指数；优选地，K-MEANS聚类算法为最佳聚类的空间聚类算法。

5.如权利要求1所述耦合多源要素的数字标牌位置推荐方法，其特征是，步骤3)利用核密度分析法计算数字标牌点要素在其周围邻域中的密度；具体地:

设在分布密度函数为f的总体中抽取出的样本为x1,x2...,xi，f在点x处的分布密度估计值为f(x)，空间位x处的核密度通过式3计算得到：

式中，fn(x)为空间位x处的核密度值；核函数k(·)；带宽h＞0；(x-xi)是估计点x到样本xi处的距离；核密度值的高低代表数字标牌分布的聚集离散程度，样本点的核密度值越高表明该样本点中的数字标牌分布越密集，表明该样本点的特征越适合数字标牌的布设。

6.如权利要求1所述耦合多源要素的数字标牌位置推荐方法，其特征是，步骤3)利用欧氏距离计算未布设数字标牌样本点与已布设数字标牌样本点之间的相似性；具体地，两个样本之间的相似度dist(X,Y)通过式4计算欧氏距离得到：

其中，dist(X,Y)为两个样本的欧氏距离，表示两个样本之间的相似度；X和Y表示两个样本，xi表示样本X中的第i个属性特征，yi表示样本Y中的第i个特征属性.其中X表示已布设数字标牌地块样本，Y表示未布设数字标牌样本。xi表示已布设数字标牌地块的第i个区位因子，yi表示未布设数字标牌样本的第i个区位因子。

7.如权利要求1所述耦合多源要素的数字标牌位置推荐方法，其特征是，步骤33)中，n取值为3。

8.如权利要求1所述耦合多源要素的数字标牌位置推荐方法，其特征是，步骤4)采用精确率、召回率及F值对数字标牌位置推荐模型进行有效性验证；具体地：

精确率表示模型推荐布设数字标牌的地块中实际布设数字标牌的地块的比例；召回率表示实际布设数字标牌的地块中模型推荐布设数字标牌的地块的比例；利用F值来综合模型的精确率与召回率。

9.如权利要求8所述耦合多源要素的数字标牌位置推荐方法，其特征是，通过式5计算精确率P：

式5中，TP表示将正类预测为正类的样本；FP表示将负类预测为正类的样本；精确率P表示预测为正的样本中真正的正样本有多少比例；

通过式6计算召回率R：

式6中，TP表示将原来的正类预测成正类；FN表示将原来的正类预测为负类；召回率R表示样本中被正确预测的正类的比例；

通过式7计算F值：

式7中，F值综合精确率P和召回率R，为有效性验证的综合指标。

完整全部详细技术资料下载

当前第2页1 2 3