兴趣点数据关联方法及装置的制造方法_6

文档序号:8258519阅读:来源:国知局
元获取到的目标P0I数据 中,确定与所述待关联P0I数据关联的目标P0I数据之前,从第一数据获取单元获取到的名 称中包含所述搜索关键词的目标P0I数据中,获取行政区划码与待关联P0I数据的行政区 划码相同的目标P0I数据; 所述数据确定单元,具体用于从第二数据获取单元获取到的行政区划码与待关联P0I 数据的行政区划码相同的目标P0I数据中,确定与所述待关联P0I数据关联的目标P0I数 据。
16. 如权利要求14所述的装置,其特征在于,还包括: 文本匹配度确定单元,用于在数据确定单元从第一数据获取单元获取到的目标P0I数 据中,确定与所述待关联P0I数据关联的目标P0I数据之前,基于向量空间模型,确定所述 搜索关键词与第一数据获取单元获取到的各目标P0I数据之间的文本匹配度; 数据排序单元,用于按照文本匹配度由大到小的顺序,对第一数据获取单元获取到的 各目标P0I数据进行排序; 第H数据获取单元,用于在排序后的各目标P0I数据中,按照文本匹配度由大到小的 顺序获取预置数目个目标POI数据; 所述数据确定单元,具体用于从第H数据获取单元获取到的预置数目个目标P0I数据 中,确定与所述待关联P0I数据关联的目标P0I数据。
17. 如权利要求14?16中任一权利要求所述的装置,其特征在于,所述预设的角色类 型包含:行政区划、主名称、特定品牌名称、修饰词、行业词、后缀词;所述搜索关键词选择 单元,具体用于: 当存在角色类型为主名称的分词时,则从各分词中,选择角色类型为主名称的分词作 为搜索关键词,结束流程;否则, 当不存在角色类型为行政区划的分词时,则按照特定品牌名称、修饰词、行业词、后缀 词优先级由高到低的顺序,从各分词中选择角色类型与特定品牌名称、修饰词、行业词或后 缀词相同且优先级最高的分词作为搜索关键词; 当存在角色类型为行政区划的分词时,则按照特定品牌名称、修饰词、行业词、后缀词 优先级由高到低的顺序,从各分词中选择角色类型与特定品牌名称、修饰词、行业词或后缀 词相同且优先级最高的分词和角色类型为行政区划的分词的组合作为搜索关键词。
18. 如权利要求14?16中任一权利要求所述的装置,其特征在于,所述数据确定单元 具体包括: 相似度确定子单元,用于根据待关联P0I数据与各获取到的目标P0I数据的属性信息, 确定待关联P0I数据与各获取到的目标P0I数据的P0I相似度; 数据确定子单元,用于根据各目标P0I数据的P0I相似度,确定与待关联P0I数据关联 的目标P0I数据。
19. 如权利要求18所述的装置,其特征在于,若P0I数据的属性包含名称、类型、地址、 地理坐标,则所述相似度确定子单元具体包括: 类型相似度确定模块,用于根据待关联P0I数据与目标P0I数据的类型,确定待关联 P0I数据与该目标P0I数据的类型相似度; 地址相似度确定模块,用于根据待关联P0I数据的地址与该目标P0I数据的地址和/ 或地理坐标,确定待关联P0I数据与该目标P0I数据的地址相似度; 名称相似度确定模块,用于根据待关联P0I数据与该目标P0I数据的名称,确定待关联 P0I数据与该目标P0I数据的名称相似度; 地理距离确定模块,用于根据待关联P0I数据的地理坐标与该目标P0I数据的地理坐 标和/或地址,确定待关联P0I数据与该目标P0I数据的地理距离; P0I相似度确定模块,用于根据所述类型相似度、地址相似度、名称相似度W及地理距 离,确定待关联P0I数据与该目标P0I数据的P0I相似度。
20. 如权利要求19所述的装置,其特征在于,若所述类型包括大类、中类及小类H个字 段,则所述类型相似度确定模块具体用于: 判断待关联P0I数据中是否存在类型该一属性信息,如果不存在,则所述待关联P0I数 据与该目标P0I数据的类型相似度等于预置的中类相似度,如果存在,则判断待关联P0I数 据与目标P0I数据的类型中的大类是否相同,如果大类不相同,则所述待关联P0I数据与该 目标P0I数据的类型相似度等于预置的联合相似度,如果大类相同,则判断二者类型中的 中类是否相同,如果中类不同或者中类为未知,则所述待关联P0I数据与该目标P0I数据的 类型相似度等于预置的大类权值,如果中类相同,则判断二者类型中的小类是否相同,如果 小类不同或者小类为未知,则所述待关联POI数据与该目标POI数据的类型相似度等于预 置的中类权值,如果小类相同,则所述待关联POI数据与该目标POI数据的类型相似度等于 预置的小类权值,其中,所述预置的大类权值< 中类权值<小类权值,所述中类相似度的绝 对值与所述中类权值的绝对值相等。
21. 如权利要求19所述的装置,其特征在于,所述地址相似度确定模块具体用于: 若所述待关联POI数据的地址及地理坐标均为已知,则根据待关联POI数据的地址与 该目标POI数据的地址,确定第一地址相似度;对待关联POI数据的地理坐标进行逆地理编 码,得到转换地址;根据待关联POI数据的转换地址与该目标POI数据的地址,确定第二地 址相似度;从所述第一地址相似度和第二地址相似度中,选择最大的一个相似度作为待关 联POI数据与该目标POI数据的地址相似度; 若所述待关联POI数据中地址为未知,地理坐标为已知,则对待关联POI数据的地理坐 标进行逆地理编码,得到转换地址;根据待关联POI数据的转换地址与该目标POI数据的地 址,得到待关联POI数据与该目标POI数据的地址相似度; 若所述待关联POI数据中地址为已知,地理坐标为未知,则根据待关联POI数据的地址 与该目标POI数据的地址,得到待关联POI数据与该目标POI数据的地址相似度。
22. 如权利要求21所述的装置,其特征在于,所述地址至少包括;道路名称和口牌号两 个字段,则所述地址相似度确定模块具体用于: 判断待关联POI数据与目标POI数据的地址中的道路名称是否相同,如果不相同,则所 述待关联POI数据与该目标POI数据的地址相似度等于预置的地址相似度值,如果相同,贝U 判断二者地址中的口牌是否相同,如果不同,则所述待关联POI数据与该目标POI数据的地 址相似度等于预置的道路名称权值,如果相同,则所述待关联POI数据与该目标POI数据的 地址相似度等于预置的口牌权值,其中,所述道路名称权值< 口牌权值。
23. 如权利要求19所述的装置,其特征在于,所述名称相似度确定模块,具体用于从待 关联POI数据的名称的分词中,获取与目标POI数据的名称的分词相同的分词;将获取出的 分词的角色类型对应的权值累加,得到待关联POI数据与该目标POI数据的名称相似度;若 未获取到相同的分词,则待关联POI数据与该目标POI数据的名称相似度等于预置的名称 相似度值。
24. 如权利要求19所述的装置,其特征在于,所述地理距离确定模块具体用于: 若所述待关联POI数据的地理坐标和地址均为已知,则根据待关联POI数据的地理坐 标与该目标POI数据的地理坐标,得到第一地理距离;对待关联POI数据的地址进行逆地理 编码,得到转换地理坐标;根据待关联POI数据的转换地理坐标与该目标POI数据的地理坐 标,得到第二地理距离;从所述第一地理距离和第二地理距离中,选择距离最小的一个地理 距离作为待关联POI数据与该目标POI数据之间的地理距离; 若所述目标POI数据的地址已知,地理坐标未知,则对待关联POI数据的地址进行逆地 理编码,得到转换地理坐标;根据待关联POI数据的转换地理坐标与该目标POI数据的地理 坐标,得到待关联POI数据与该目标POI数据的地理距离; 若所述目标POI数据的地址未知,地理坐标已知,则根据待关联POI数据的地理坐标与 该目标POI数据的地理坐标,得到待关联POI数据与该目标POI数据的地理距离。
25. 如权利要求19所述的装置,其特征在于,所述POI相似度确定模块,具体用于将所 述类型相似度、地址相似度、名称相似度累加,得到第一联合相似度;根据预置的地理距离 范围与相似度调整值的对应关系,得到所述地理距离所在的地理距离范围对应的相似度调 整值;将所述第一联合相似度与所述相似度调整值累加,得到待关联P0I数据与该目标P0I 数据的P0I相似度。
26. 如权利要求25所述的装置,其特征在于,所述数据确定单元具体用于: 将各目标P0I数据按照相似度由高到低的顺序进行排序,若存在相似度相同的目标 P0I数据,则将相似度相同的目标P0I数据按照地理距离由小到大的顺序进行排序; 根据预置的P0I相似度范围与关联精度等级的对应关系,得到各目标P0I数据的P0I 相似度所在的P0I相似度范围对应的关联精度等级,其中,关联精度等级包含高精度关联、 较高精度关联、中等精度关联和不关联; 判断是否存在关联精度等级为高精度关联的目标P0I数据,如果存在,则将关联精度 等级为高精度关联的目标P0I数据中,排在第一位的目标P0I数据确定为所述待关联P0I 数据关联的目标P0I数据,如果不存在,则判断是否存在关联精度等级为较高精度关联的 目标P0I数据,如果存在,则将关联精度等级为较高精度关联的各目标P0I数据中,排在第 一位的目标P0I数据确定为所述待关联P0I数据关联的目标P0I数据,如果不存在,则判断 是否存在关联精度等级为中等精度关联的目标P0I数据,如果存在,则返回关联精度等级 为中等精度关联的各目标P0I数据,如果不存在,则结束流程。
【专利摘要】本发明公开了一种兴趣点数据关联方法及装置,该方法包括:将待关联兴趣点POI数据的名称进行分词处理,得到组成所述名称的分词;对各分词进行角色标注,得到各分词的角色类型;按照预设的角色类型优先级顺序,从各分词中选择角色类型与预设的角色类型相同且优先级最高的分词作为搜索关键词;从目标POI数据库中,获取名称中包含所述搜索关键词的目标POI数据;从获取到的目标POI数据中,确定与所述待关联POI数据关联的目标POI数据。采用本发明技术方案,解决了现有技术中POI数据关联的处理效率非常低的问题。
【IPC分类】G06F17-30
【公开号】CN104572645
【申请号】CN201310472877
【发明人】胡云喜
【申请人】高德软件有限公司
【公开日】2015年4月29日
【申请日】2013年10月11日
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1