兴趣点数据融合方法和系统的制作方法_2

文档序号:9564583阅读:来源:国知局
息Μ融合时,对于目标Ρ0Ι数据与Ρ0Ι信息Μ中的名称信息,将长度最长的名称信息作为融合后的名称信息;对于目标Ρ0Ι数据与Ρ0Ι信息Μ中的地址信息,将长度最长的地址信息作为融合后的地址信息;对于目标Ρ0Ι数据与Ρ0Ι信息Μ中的电话信息,将两个电话信息共同作为融合后的电话信息。
[0049]在一个实施例中,融合存储单元具体在将目标Ρ0Ι数据与Ρ0Ι信息Μ融合时,记录目标Ρ0Ι数据的来源标识。
[0050]在一个实施例中,区域确定单元具体在预定的第η层经纬度网格中,生成以目标POI数据的经纬度为圆心、以预定的长度为半径的圆形区域,以作为所述区域R。
[0051]本发明通过筛选与目标Ρ0Ι数据相近的候选Ρ0Ι信息,在候选Ρ0Ι信息中判断是否存在与目标Ρ0Ι数据相重复的Ρ0Ι信息。若不存在与目标Ρ0Ι数据相重复的Ρ0Ι信息,则直接将目标Ρ0Ι数据存入Ρ0Ι集合,否则将目标Ρ0Ι数据与相重复的Ρ0Ι信息融合。从而可有效解决数据处理速度慢、数据处理准确性和容错性不足的问题。
【附图说明】
[0052]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0053]图1为本发明兴趣点数据融合方法一个实施例的示意图。
[0054]图2为本发明经纬度网格划分一个实施例的示意图。
[0055]图3为本发明确定候选Ρ0Ι信息一个实施例的示意图。
[0056]图4为本发明二级hash结构一个实施例的示意图。
[0057]图5为本发明兴趣点数据融合系统一个实施例的示意图。
[0058]图6为本发明候选信息确定单元一个实施例的示意图。
【具体实施方式】
[0059]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060]除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
[0061]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0062]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
[0063]在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
[0064]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0065]图1为本发明兴趣点数据融合方法一个实施例的方法。如图1所示,本实施例的方法步骤可包括:
[0066]步骤101,当获得新的目标兴趣点Ρ0Ι数据时,提取出目标Ρ0Ι数据的经纬度。
[0067]步骤102,在预定的第η层经纬度网格中,确定以目标Ρ0Ι数据的经纬度为中心的区域R。
[0068]优选的,在预定的第η层经纬度网格中,生成以目标POI数据的经纬度为圆心、以预定的长度为半径的圆形区域,以作为所述区域R。
[0069]例如,预定的长度可以为2公里。
[0070]步骤103,将在第η层经纬度网格中被区域R覆盖的网格作为候选网格。
[0071]步骤104,在Ρ0Ι集合中提取出与候选网格相关联的Ρ0Ι信息,以作为候选Ρ0Ι信肩、Ο
[0072]通过上述处理,可显著减小信息处理量,明显提高数据处理效率。
[0073]步骤105,判断在候选Ρ0Ι信息中,是否存在与目标Ρ0Ι数据相重复的Ρ0Ι信息。
[0074]优选的,对于候选Ρ0Ι信息中的每个候选Ρ0Ι信息Cj,判断目标Ρ0Ι数据与候选Ρ0Ι信息Cj之间的相似度FinalScore是否大于预定的阈值,其中1彡j彡M,M为候选Ρ0Ι信息总数,相似度FinalScore同目标Ρ0Ι数据与候选Ρ0Ι信息Cj之间的名称相似度、电话相似度、距离相似度和地址相似度相关。
[0075]若目标Ρ0Ι数据与候选Ρ0Ι信息Cj之间的相似度FinalScore大于预定的阈值,则确定目标Ρ0Ι数据与候选Ρ0Ι信息Cj重复。
[0076]若目标Ρ0Ι数据与候选Ρ0Ι信息Cj之间的相似度FinalScore不大于预定的阈值,则确定目标Ρ0Ι数据与候选Ρ0Ι信息Cj不重复。
[0077]优选的,可利用下列公式
[0078]FinalScore = (nameScore+phoneScore)*weightl+(distanceScore+addressScore)氺weight2
[0079]计算相似度FinalScore,其中weightl和weight2预先设置的权值,名称相似度nameScore同目标Ρ0Ι数据与候选Ρ0Ι信息Cj的名称、类型相关联,电话相似度phoneScore同目标Ρ0Ι数据与候选Ρ0Ι信息Cj的电话信息相关联,距离相似度distanceScore同目标Ρ0Ι数据与候选Ρ0Ι信息Cj的经纬度相关联,地址相似度addressScore同目标Ρ0Ι数据与候选Ρ0Ι信息Cj的地址相关联。
[0080]例如:nameScore、addressScore、distanceScore 可以为:
[0081]nameScore = scoreName (clean (namel),clean (name2),typel, type2)
[0082]addressScore = scoreAddress (clean (addressl)+clean (address2),latitudel, longitudel, latitude2,longitude2)
[0083]distanceScore = 1-distance/threshold
[0084]其中,scoreName为确定两个POI数据1和POI数据2的名称和类型的相似度的函数addressScore为确定Ρ0Ι数据1和Ρ0Ι数据2的地址和经纬度的相似度的函数;clean为去除附加信息的函数,以便于更好地进行相似度计算distance为两个Ρ0Ι数据的距离,threshold为相应门限。
[0085]步骤106,若在候选Ρ0Ι信息中不存在与目标Ρ0Ι数据相重复的Ρ0Ι信息,则将目标Ρ0Ι数据存入Ρ0Ι集合。
[0086]步骤107,若在候选Ρ0Ι信息中存在与目标Ρ0Ι数据相重复的Ρ0Ι信息M,则将目标Ρ0Ι数据与Ρ0Ι信息Μ融合,并将融合后的信息存入Ρ0Ι集合,以对Ρ0Ι信息Μ进行更新。
[0087]基于本发明上述实施例提供的兴趣点数据融合方法,通过筛选与目标Ρ0Ι数据相近的候选Ρ0Ι信息,在候选Ρ0Ι信息中判断是否存在与目标Ρ0Ι数据相重复的Ρ0Ι信息。若不存在与目标POI数据相重复的P0I信息,则直接将目标P0I数据存入P0I集合,否则将目标P0I数据与相重复的P0I信息融合。从而可有效解决数据处理速度慢、数据处理准确性和容错性不足的问题。
[0088]在一个实施例中,可将全球经纬度平面做L层深度的网格划分,例如L为16。如图2所示,在一个网格中,经纬度坐标(-90,-180)至(0,0)的子网格的索引为1,经纬度坐标(90,-180)至(0,0)的子网格的索引为2,经纬度坐标(-90,180)至(0,0)的子网格的索引为3,经纬度坐标(90,180)至(0,0)的子网格的索引为4。在图2中,目标Ρ0Ι数据的网格索引为14。若以目标Ρ0Ι数据的经纬度为圆心、以预定的长度为半径形成的圆形区域,则覆盖的区域为14、13。
[0089]优选的,从数据处理效率考虑,上述第14层经纬度网格中进行处理,即上述η =14ο
[0090]优选的,如图3所示,上述在Ρ0Ι集合中提取出与候选网格相关联的Ρ0Ι信息,以作为候选Ρ0Ι信息的步骤可包括:
[0091]步骤301,判断候选网格Gi是否为底层网格,其中1彡i彡N,N为候选网格总数。若网格Gi是底层网格,则执行步骤302 ;若网格Gi不是底层网格,则执行步骤303。
[0092]步骤302,将Ρ0Ι集合中与候选网格Gi相关联的Ρ0Ι信息作为候选Ρ0Ι信息。之后,不再执行本实施例的其它步骤。
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1