一种志愿者编辑能力的评估方法及系统与流程

文档序号:11134065阅读:359来源:国知局
一种志愿者编辑能力的评估方法及系统与制造工艺

本发明涉及评价方法的技术领域,尤其涉及一种志愿者编辑能力的评估方法及系统。



背景技术:

OSM(Open Street Map,街道开放地图)志愿者地理数据具有现势性强、数据量大、信息丰富及成本低廉等特点和优势,已逐渐应用于应急制图、地图更新、灾害救援、基于位置服务等研究领域。但是,由于这种志愿者地理信息主要由未经过培训的非专业志愿者自发采集并上传,志愿者的水平高低不同,数据制作过程相对独立,采集数据的设备精度不一致,因此得到的数据质量存在很大的差异。在一些经济发展快、人口密度大的区域,数据被编辑的次数较多,其质量也明显优于其它区域。这便导致了志愿者地理信息存在信息冗余,信息缺乏质量或质量信息不精确等问题的产生。而空间数据作为地理信息领域的各项应用和研究的基础,其质量问题深刻地影响着最终成果和决策的可靠性及准确性。

因此,OSM的数据质量一直是人们关注的焦点,很多专家学者和研究人员对其进行了研究,并且建立了一些质量分析模型、评价体系和评价方法。但是这些质量评估过程需要将待评估的数据和第三方数据集进行比较。而由于第三方数据集的质量水平不同,第三方数据集的获取困难,同时这些数据集多为官方数据或商业数据,存在着更新慢等问题,因此不能有效及时地得到OSM数据的质量评估结果。



技术实现要素:

本发明通过提供一种志愿者编辑能力的评估方法及系统,解决了现有技术中必须要借助于第三方数据集对志愿者的地图数据进行评估的技术问题,实现了能够有效及时地得到OSM数据的质量评估结果的技术效果。

本发明提供了一种志愿者编辑能力的评估方法,至少包括:

获取志愿者在评估区域对空间对象编辑的地图数据;

根据志愿者对所述空间对象的第j次编辑生成的第j个版本Vj的地图数据与所述空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平;

根据志愿者在所述评估区域的所有编辑活动的编辑水平,得到志愿者在所述评估区域的平均编辑水平EL;

根据志愿者编辑活动的总次数N得到志愿者的等级LN;具体包括:

当N>200时,志愿者的等级LN=0.5;

当20≤N≤200时,志愿者的等级LN=0.3;

当N<20时,志愿者的等级LN=0.2;

根据公式L=αLN+βEL得到志愿者的编辑能力L;

其中,α和β为水平调整参数,由EL和LN对得到L时的贡献度决定。

进一步地,所述获取志愿者在评估区域对空间对象编辑的地图数据,具体包括:获取志愿者在所述评估区域对所有空间对象的所有编辑的地图数据。

进一步地,所述根据志愿者对所述空间对象的第j次编辑生成的第j个版本Vj的地图数据与所述空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平,具体包括:

根据志愿者对所述空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在所述空间对象所有版本的地图数据集中出现的次数,得到志愿者在编辑版本Vj时的编辑水平。

进一步地,所述地图数据中的特征信息包括:地图数据中像素点的坐标值、地图数据中像素点的色彩信息和/或地图数据中像素点的描述信息。

进一步地,在所述根据志愿者编辑活动的总次数N得到志愿者的等级LN之前,获取所述志愿者上传的所有地图数据,分析所述地图数据,得到所述志愿者编辑活动的总次数N。

本发明提供的志愿者编辑能力的评估系统,至少包括:

数据获取模块,用于获取志愿者在评估区域对空间对象编辑的地图数据;

第一运算模块,用于根据志愿者对所述空间对象的第j次编辑生成的第j个版本Vj的地图数据与所述空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平;

第二运算模块,用于根据志愿者在所述评估区域的所有编辑活动的编辑水平,得到志愿者在所述评估区域的平均编辑水平EL;

第三运算模块,用于根据志愿者编辑活动的总次数N得到志愿者的等级LN;具体包括:

当N>200时,志愿者的等级LN=0.5;

当20≤N≤200时,志愿者的等级LN=0.3;

当N<20时,志愿者的等级LN=0.2;

第四运算模块,用于根据公式L=αLN+βEL得到志愿者的编辑能力L;

其中,α和β为水平调整参数,由EL和LN对得到L时的贡献度决定。

进一步地,所述数据获取模块,具体用于获取志愿者在所述评估区域对所有空间对象的所有编辑的地图数据。

进一步地,所述第一运算模块,具体用于根据志愿者对所述空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在所述空间对象所有版本的地图数据集中出现的次数,得到志愿者在编辑版本Vj时的编辑水平。

进一步地,所述地图数据中的特征信息包括:地图数据中像素点的坐标值、地图数据中像素点的色彩信息和/或地图数据中像素点的描述信息。

进一步地,还至少包括:

遍历模块,用于获取所述志愿者上传的所有地图数据,分析所述地图数据,得到所述志愿者编辑活动的总次数N。

本发明中提供的一个或多个技术方案,至少具有如下技术效果或优点:

先基于获取志愿者在评估区域对空间对象编辑的地图数据,再根据志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据与空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平,再根据志愿者在评估区域的所有编辑活动的编辑水平,得到志愿者在评估区域的平均编辑水平EL,再根据志愿者编辑活动的总次数N得到志愿者的等级LN,最后根据公式L=αLN+βEL得到志愿者的编辑能力L,实现了在不依赖于第三方数据集情况下,通过分析志愿者的编辑活动和数据认可情况,量化表达了志愿者编辑的空间对象的可靠性,从而有效及时地得到了OSM数据的质量评估结果。

附图说明

图1为本发明实施例提供的志愿者编辑能力的评估方法的流程图;

图2为通过本发明实施例提供的志愿者编辑能力的评估方法对武汉市志愿者编辑能力进行评价的流程图;

图3为本发明实施例提供的志愿者编辑能力的评估系统的模块图。

具体实施方式

本发明实施例通过提供一种志愿者编辑能力的评估方法及系统,解决了现有技术中必须要借助于第三方数据集对志愿者的地图数据进行评估的技术问题,实现了能够有效及时地得到OSM数据的质量评估结果的技术效果。

本发明实施例中的技术方案为解决上述技术问题,总体思路如下:

先基于获取志愿者在评估区域对空间对象编辑的地图数据,再根据志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据与空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平,再根据志愿者在评估区域的所有编辑活动的编辑水平,得到志愿者在评估区域的平均编辑水平EL,再根据志愿者编辑活动的总次数N得到志愿者的等级LN,最后根据公式L=αLN+βEL得到志愿者的编辑能力L,实现了在不依赖于第三方数据集情况下,通过分析志愿者的编辑活动和数据认可情况,量化表达了志愿者编辑的空间对象的可靠性,从而有效及时地得到了OSM数据的质量评估结果。

为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

参见图1,本发明实施例提供的志愿者编辑能力的评估方法,至少包括:

步骤S110:获取志愿者在评估区域对空间对象编辑的地图数据;

对本步骤进行说明:

获取志愿者在评估区域对所有空间对象的所有编辑的地图数据。

步骤S120:根据志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据与空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平;

对本步骤进行说明:

根据志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在空间对象所有版本的地图数据集中出现的次数,得到志愿者在编辑版本Vj时的编辑水平。若志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在空间对象所有版本的地图数据集中出现的次数越多,则志愿者在编辑版本Vj时的编辑水平就越高。反之,志愿者在编辑版本Vj时的编辑水平越低。

具体地,可以基于志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在所有版本中出现的次数与所有版本的总数之间的比值得到志愿者在编辑版本Vj时的编辑水平,也可以根据地图数据中的特征信息每出现一次,则志愿者的编辑水平就加一的方法来得到志愿者在编辑版本Vj时的编辑水平,本发明实施例对此不做出具体限制。

在本实施例中,地图数据中的特征信息包括:地图数据中像素点的坐标值、地图数据中像素点的色彩信息和/或地图数据中像素点的描述信息等。

步骤S130:根据志愿者在评估区域的所有编辑活动的编辑水平,得到志愿者在评估区域的平均编辑水平EL;

步骤S140:根据志愿者编辑活动的总次数N得到志愿者的等级LN;具体包括:

当N>200时,志愿者的等级LN=0.5;

当20≤N≤200时,志愿者的等级LN=0.3;

当N<20时,志愿者的等级LN=0.2;

具体地,先获取志愿者上传的所有地图数据,分析地图数据,得到志愿者编辑活动的总次数N。

步骤S150:根据公式L=αLN+βEL得到志愿者的编辑能力L;

其中,α和β为水平调整参数,由EL和LN对得到L时的贡献度决定。

在本实施例中,α和β的取值在0到1之间。

步骤S160:将志愿者的编辑能力L应用到信任评估模型(trust model)和众包方法(the crowd-sourcing approach)中。

参见图2,通过本发明实施例对武汉市志愿者编辑能力进行评价的步骤如下:

步骤S201:采用开放街道地图官方网站提供的下载功能获取武汉市在某时刻的开放街道地图数据。

具体地,先根据数据量的大小选择一次性下载还是分块下载,然后根据需要选择开放街道地图的历史数据,建立武汉市的开放街道地图数据集A。具体操作如下:

(1)如果武汉市的开放街道地图数据量小于预设值,可以一次性下载,则直接将其保存到本地磁盘;如果武汉市的开放街道地图数据量大于预设值,不能一次性下载,则按照几何形状将下载区域分成若干份进行下载。需要说明的是,在下载时,将每个小区域的轮廓向外扩充,以便保证能够下载所有的地图数据。但是由于这种方式下载的数据集中有较大的冗余,因此需要利用Arcgis软件对下载的数据进行预处理,删除重复的数据,消除冗余,并且将多个图层数据集成到一张图层中,以便数据的选取和检验。

(2)按照随机取样的原理从上述预处理后的数据集中选取n个要素,然后利用API函数从OSM数据库中下载这n个要素的所有历史数据,并保存到本地磁盘构成数据集A。

在本实施例中,数据集A={A1,A2,A3,、、、,Ai,、、、,An};其中,n表示数据集A中要素的个数,且n≥1;第i个要素Ai是志愿者对某一空间对象进行编辑后上传到开放街道的编辑结果,采用一维向量表示,即Ai=(V1,V2,V3,、、、,Vi,、、、,Vk);其中,k表示每个要素的版本个数。

步骤S202:根据数据集A中的某一要素的历史文件,进行预处理;

步骤S203:保留同一个志愿者连续编辑之后的最终版本作为志愿者编辑水平评估过程中采用的数据集,遍历要素的所有历史版本数据,计算该志愿者此次编辑水平。具体过程如下:

(1)在VGI编辑活动过程中,由于某些原因可能导致某一志愿者在短期内连续编辑同一目标,从而导致数据集中存在同一志愿者编辑该目标的多个相邻版本。在数据集中的表现为要素Ai=(V1,V2,、、、,Vj,、、、,Vn)的连续几个版本的id和uid相同,timestam表示的时间相差几秒。对于这样的数据,最后一个版本的信息往往是志愿者最终决定上传的信息和最为完整的信息。在计算编辑者的编辑能力时保留同一个志愿者连续编辑之后的最终版本,因此评估时采用的要素Ai=(V1,V2,、、、,Vj,、、、Vk-m)。其中,m表示要素Ai有m个版本的数据是连续编辑产生的多余版本。

(2)对要素Ai=(V1,V2,V3,、、、,Vj,、、、,Vk-m)中的k-m个版本数据进行分析,遍历要素的所有历史版本数据,计算版本Vj的可信程度,即该志愿者此次编辑水平。下面具体介绍编辑水平的计算方法:

①对(k-m)个版本的数据进行统计,对于重复项并不删除,得到所有数据的集合;

②计算版本Vj的可信程度,计算方法采用下面的公式

步骤S204:根据志愿者的UID调用API获取该志愿者的所有地图数据的个数N;

步骤S205:遍历志愿者在武汉市的所有编辑活动,统计其在武汉市的所有编辑活动的水平值,建立集合C={P(AiVj)|1≤i≤n,1≤j≤(k-m),且P(AiVj)的是同一个志愿者的编辑版本的可信度}。

步骤S206:按照志愿者的所有地图数据的个数N划分志愿者的等级LN,按照所有的编辑水平值求解其编辑水平平均值EL。具体过程如下:

(1)根据步骤S204中的所有地图数据的个数N,把志愿者分成三个等级。当N>200时,志愿者等级LN=0.5;当20≤N≤200时,志愿者等级LN=0.3;当N<20时,志愿者等级LN=0.2。

(2)根据步骤S205中的集合C,按照下面的公式计算志愿者的编辑水平平均值EL,其中M是集合C的元素个数。

这里需要说明的是,在统计志愿者的所有地图数据的个数N时,并没有限定编辑的时间和编辑的区域,而是统计从注册到评估开始之间的所有地图数据的个数。但是在统计志愿者的编辑水平平均值时,志愿者对某一空间对象进行编辑时会受到地域的影响。为了消除这种影响,只考虑在该评估区域的所有编辑活动的水平值。

步骤S207:根据公式L=αLN+βEL计算最终的志愿者的编辑能力L,并将志愿者UID和L值保存到志愿者编辑能力表LList中,以便后续步骤中的访问和使用。需要说明的是,因为志愿者的编辑能力受到了多方面的影响,评估时采用的参数也比较多。根据在任何特定群体中,重要的因子通常只占少数,而不重要的因子则占多数,因此只要能控制具有重要性的少数因子即能控制全局,所以本发明实施例在衡量志愿者编辑能力时采用80/20的法则来确定α和β的取值。具体地,在本实施例中,α取0.2,β取0.8。L的取值范围在[0,1],当L∈[0,0.6]时,志愿者的编辑能力较差;当L∈[0.6,0.85]时,志愿者编辑能力一般;当L∈[0.85,1]时,志愿者编辑能力很好。

步骤S208:将数据集A中的数据导入要素表,迭代遍历要素表中的所有要素,并提取每个要素的所有操作,建立操作表OpList。

步骤S209:根据要素的id将所有的操作进行组,在组内根据要素的版本数进行进一步细分,建立操作序OListj(i=1,2,···,k)。其中,j表示当前要素的版本数,OListj表示志愿者第j次编辑此要素时所有操作的集合。

步骤S210:根据要素评估表对每个要素进行打分OL。

步骤S211:计算每个操作的最后分值ROL=L*OL,在组内根据操作的ROL进行排序,有序序列的第一操作表明了该组可以提取什么样的子活动。

步骤S212:根据子活动集成关系将子活动集成,在计算每个子活动的质量值RAL=AL*L。

参见图3,本发明实施例提供的志愿者编辑能力的评估系统,至少包括:

数据获取模块100,用于获取志愿者在评估区域对空间对象编辑的地图数据;

在本实施例中,数据获取模块100,具体用于获取志愿者在评估区域对所有空间对象的所有编辑的地图数据。

第一运算模块200,用于根据志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据与空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平。

在本实施例中,第一运算模块200,具体用于根据志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在空间对象所有版本的地图数据集中出现的次数,得到志愿者在编辑版本Vj时的编辑水平。若志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在空间对象所有版本的地图数据集中出现的次数越多,则志愿者在编辑版本Vj时的编辑水平就越高。反之,志愿者在编辑版本Vj时的编辑水平越低。

具体地,可以基于志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据中的特征信息在所有版本中出现的次数与所有版本的总数之间的比值得到志愿者在编辑版本Vj时的编辑水平,也可以根据地图数据中的特征信息每出现一次,则志愿者的编辑水平就加一的方法来得到志愿者在编辑版本Vj时的编辑水平,本发明实施例对此不做出具体限制。

其中,地图数据中的特征信息包括:地图数据中像素点的坐标值、地图数据中像素点的色彩信息和/或地图数据中像素点的描述信息等。

第二运算模块300,用于根据志愿者在评估区域的所有编辑活动的编辑水平,得到志愿者在评估区域的平均编辑水平EL;

遍历模块400,用于获取志愿者上传的所有地图数据,分析地图数据,得到志愿者编辑活动的总次数N;

第三运算模块500,用于根据志愿者编辑活动的总次数N得到志愿者的等级LN;具体包括:

当N>200时,志愿者的等级LN=0.5;

当20≤N≤200时,志愿者的等级LN=0.3;

当N<20时,志愿者的等级LN=0.2;

第四运算模块600,用于根据公式L=αLN+βEL得到志愿者的编辑能力L;

其中,α和β为水平调整参数,由EL和LN对得到L时的贡献度决定。

在本实施例中,α和β的取值在0到1之间。

推送模块700,用于将志愿者的编辑能力L应用到信任评估模型(trust model)和众包方法(the crowd-sourcing approach)中。

【技术效果】

1、先基于获取志愿者在评估区域对空间对象编辑的地图数据,再根据志愿者对空间对象的第j次编辑生成的第j个版本Vj的地图数据与空间对象所有版本的地图数据集的重合程度,得到志愿者在编辑版本Vj时的编辑水平,再根据志愿者在评估区域的所有编辑活动的编辑水平,得到志愿者在评估区域的平均编辑水平EL,再根据志愿者编辑活动的总次数N得到志愿者的等级LN,最后根据公式L=αLN+βEL得到志愿者的编辑能力L,实现了在不依赖于第三方数据集情况下,通过分析志愿者的编辑活动和数据认可情况,量化表达了志愿者编辑的空间对象的可靠性,从而有效及时地得到了OSM数据的质量评估结果。

2、在获取志愿者在评估区域对空间对象编辑的地图数据之后,将多个图层数据集成到一张图层中,从而便于数据的选取和检验。

3、将志愿者的编辑能力L应用到信任评估模型(trust model)和众包方法(the crowd-sourcing approach)中,以便调整志愿者操作的水平等级,从而能够有效地提取正确的子活动,进而完善了志愿者编辑活动评估模型,进而提高了志愿者地理信息数据的评估质量。

本发明实施例在评估开放街道地图的数据时,充分地考虑了志愿者编辑能力的影响,调整了每个操作的质量水平,使得子活动的提取过程更加科学合理。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1