一种志愿者地理信息信誉度计算方法

文档序号:8299166阅读:1225来源:国知局
一种志愿者地理信息信誉度计算方法
【技术领域】
[0001] 本发明属于众源地理信息(VGI)应用技术领域,具体涉及一种志愿者地理信息信 誉度计算方法。
【背景技术】
[0002] 数据质量问题一直是地理信息行业的一个基础性问题,由于志愿者地理信息 (VolunteeredGeographicInformation,VGI)或众源信息(Crowd-sourcingdata)是由大 众志愿者自发标报,其中存在大量恶意、虚假、低质量数据,与传统专业人员获取数据相比, 其可信度具有诸多不确定性,需进行可信性评价后方可放心使用【武汉大学学报:信息科 学版,2010.李德仁,钱新林,浅论自发地理信息的数据管理】。但目前这方面的研宄工作还 刚刚起步,研宄成果包括定性分析和定量计算两方面。
[0003] 在定性评价和分析方面,许多众源信息系统采用类似专家评审方式,评审人员由 专家或者普通大众(非专业人士)组成。Van Exel和Dias研宄众源地理信息系统与一般 协作知识平台的区别,提出了评价众源数据质量的概念模型Crowd Quality【Proceedings of the 6th GIScience international conference on geographic information science, 2010.Van Exel, M. , E. Dias and S. Fruijtier, The impact of crowdsourcing on spatial data quality indicators】,该模型影响众源地理信息质量的因素包括: 用户经验、本地知识、要素来源等。G〇〇dchild&Li(2012)深入分析了确保VGI数据质量 的三种途径:众源方法(Crowd-sourcing approach)、社会方法(Social approach)及 地理方法(Geographic approach)【Spatial statistics, 2012. Goodchild, M. F. and L. Li (2012), Assuring the quality of volunteered geographic information】。另夕卜还 有Bishr和Janowicz (2010)提出信息信任(Informational trust)概念等。上述定性分 析研宄成果对VGI数据质量控制与可信性度量具有重要参考价值,但是由于缺少对影响因 素的定量化计算方法,不能直接用于VGI数据质量的自动检查与评价。
[0004] 在VGI数据质量定量评价方面,目前的研宄工作主要集中在将VGI数据与已有 专业数据库比较评价方面。多位学者对感兴趣区域的VGI数据与专业数据进行了对比分 析【Transactions in GIS,2010, Girres, J. F. and G. Touya. Quality assessment of the French OpenStreetMap dataset】,通过对比分析学者们普遍认为在欧洲城市区域众源数 据的平均位置精度优于7m,现势性与丰富程度甚至超过专业数据,但VGI存在严重的不完 整性和各地区不均匀问题。由于这类方法需要高精度专业数据集,难以在VGI数据质量评 价普遍应用。
[0005] 总之,目前尽管志愿者地理信息系统已发展多年,收集了大量的志愿者地理信息, 但由于缺少可定量评价志愿者地理信息信誉度的方法与系统,不能全面评价每个志愿者、 每个志愿者地理信息版本的可信度(或可靠性),不能科学地对其进行全面清洗或筛选,使 得当前志愿者地理信息的数据质量参差不齐、存在大量恶意、虚假、低质量数据;系统采用 的目标版本仅看编辑生成时间,不做质量评价,导致了系统服务使用目标版本并非最佳版 本等问题。

【发明内容】

[0006] 本发明所解决的技术问题是,针对现有技术方法存在的不足,提供了一种志愿者 地理信息信誉度计算方法,可较客观地评价出志愿者地理信息可信度,为志愿者地理信息 清洗与筛选提供科学依据。
[0007] 本发明的技术方案为:
[0008] 一种志愿者地理信息信誉度计算方法,VGI(志愿者地理信息)目标的版本Vi的信 誉度7:计算方法为:
【主权项】
1. 一种志愿者地理信息信誉度计算方法,其特征在于,VGI目标的版本^的信誉度 计算方法为:
其中,i为某VGI目标的版本\的序号,R(Ci)表示版本\的贡献者^的信誉度, 表示版本Vh的信誉度,J(G))表示取2^和R(Ci)中的较大值;ER(Vi,vg)表示版本Vi对版本vh的编辑比例,ER(vi,Vh)的计算方法为: ER(Vi,v^) = l-VerSim^i, 其中VerSimh,Vg)表示版本¥1与v ^的相似度。
2. 根据权利要求1所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者 (^的信誉度R(Ci)的计算方法为; R(Ci) = R0(Ci) ? e_m/M+Re(Ci) ? (l-e_m/M) 其中,为贡献者(^的初始信誉度,Re(Ci)为贡献者(^的评价信誉度,e是自然常 数,m表示贡献者(^被评价的次数,M为正的自然数常量。
3. 根据权利要求2所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者 Ci的初始信誉度R ^ (Ci)根据贡献者Ci注册信息中的诚信维和能力维元素的分值计算,诚信 维的元素包括真实姓名、身份ID、手机号码和email信息;能力维的元素包括用来确定贡献 者贡献能力的信息;具体地,贡献者 Ci的初始信誉Rjq)根据下式计算:
其中,4表示诚信维的第a个元素的分值(1 < a < A),Max (f a)表示A个诚信维元素 的分值中的最大值;〇b表示能力维元素b的分值a彡b彡b),) / 〃表示各个能力维 元素的分值的平均值,B表示能力维的元素总数,a表示诚信维的权值。
4. 根据权利要求3所述的志愿者地理信息信誉度计算方法,其特征在于,所述真实姓 名、身份ID、手机号码和email的分值根据四者的认证情况确定; 真实姓名、身份ID和手机号码的认证方法包括形式认证和基于联网数据库的真实性 认证,若形式认证和基于联网数据库的真实性认证都通过,则分值为" 1" ;若无法进行基于 联网数据库的真实性认证,只能进行形式认证,则形式正确,分值为"0.5";否则分值为"0"; email信息的认证方法包括形式认证和有效性验证;形式认证即根据邮箱形
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1