兴趣点数据关联方法及装置的制造方法_3

文档序号:8258519阅读:来源:国知局
匹配度;数据排序单元,用于按照文本匹配度由大到小的顺序,对第一数据获取单 元获取到的各目标P0I数据进行排序;第三数据获取单元,用于在排序后的各目标P0I数据 中,按照文本匹配度由大到小的顺序获取预置数目个目标P0I数据;所述数据确定单元,具 体用于从第三数据获取单元获取到的预置数目个目标P0I数据中,确定与所述待关联P0I 数据关联的目标P0I数据。由上可见,根据文本匹配度,对使用搜索关键词初步筛选出的目 标P0I数据进行进一步过滤,能够进一步节省查找关联的P0I数据的工作量,提高P0I数据 关联的处理效率。
[0032] 优选的,所述预设的角色类型包含:行政区划、主名称、特定品牌名称、修饰词、行 业词、后缀词;所述搜索关键词选择单元,具体用于:当存在角色类型为主名称的分词时, 则从各分词中,选择角色类型为主名称的分词作为搜索关键词,结束流程;否则,当不存在 角色类型为行政区划的分词时,则按照特定品牌名称、修饰词、行业词、后缀词优先级由高 到低的顺序,从各分词中选择角色类型与特定品牌名称、修饰词、行业词或后缀词相同且优 先级最高的分词作为搜索关键词;当存在角色类型为行政区划的分词时,则按照特定品牌 名称、修饰词、行业词、后缀词优先级由高到低的顺序,从各分词中选择角色类型与特定品 牌名称、修饰词、行业词或后缀词相同且优先级最高的分词和角色类型为行政区划的分词 的组合作为搜索关键词。在POI数据的名称对应的各分词中,角色类型为主名称的分词往 往最能反映POI数据的名称的个性化特点,因此,当存在角色类型为主名称的分词时,将角 色类型为主名称的分词作为搜索关键词能够使得通过搜索关键词初步筛选出的目标POI 数据与待关联POI数据非常相关,从而大大节省了进一步查找关联的POI数据的工作量,有 效地提高了POI数据关联的处理效率。
[0033] 优选的,所述数据确定单元具体包括:相似度确定子单元,用于根据待关联P0I数 据与各获取到的目标P0I数据的属性信息,确定待关联P0I数据与各获取到的目标P0I数 据的P0I相似度;数据确定子单元,用于根据各目标P0I数据的P0I相似度,确定与待关联 P0I数据关联的目标P0I数据。由上可见,待关联P0I数据与目标P0I数据之间的P0I相似 度是根据待关联P0I数据与目标P0I数据的各属性信息确定出的,因此P0I相似度能够反 映待关联P0I数据和目标P0I数据针对各属性信息的相关性,即使待关联P0I数据的某一 属性信息存在误差,也能综合考虑其他属性信息,根据P0I相似度确定出关联的P0I数据, 因此提_了P0I数据关联的关联精度。
[0034] 优选的,若P0I数据的属性包含名称、类型、地址、地理坐标,则所述相似度确定子 单元具体包括:类型相似度确定模块,用于根据待关联P0I数据与目标P0I数据的类型,确 定待关联P0I数据与该目标P0I数据的类型相似度;地址相似度确定模块,用于根据待关联 P0I数据的地址与该目标P0I数据的地址和/或地理坐标,确定待关联P0I数据与该目标 P0I数据的地址相似度;名称相似度确定模块,用于根据待关联P0I数据与该目标P0I数据 的名称,确定待关联P0I数据与该目标P0I数据的名称相似度;地理距离确定模块,用于根 据待关联P0I数据的地理坐标与该目标P0I数据的地理坐标和/或地址,确定待关联P0I 数据与该目标P0I数据的地理距离;P0I相似度确定模块,用于根据所述类型相似度、地址 相似度、名称相似度以及地理距离,确定待关联P0I数据与该目标P0I数据的P0I相似度。 由上可见,待关联P0I数据与目标P0I数据之间的P0I相似度是根据类型相似度、地址相 似度、名称相似度以及地理距离确定出的,因此P0I相似度能够反映待关联P0I数据和目标 P0I数据针对各属性信息的相关性,即使待关联P0I数据的某一属性信息存在误差,也能综 合考虑其他属性信息,根据P0I相似度确定出关联的P0I数据,因此提高了P0I数据关联的 关联精度。
[0035] 优选的,若所述类型包括大类、中类及小类三个字段,则所述类型相似度确定模块 具体用于:判断待关联P0I数据中是否存在类型这一属性信息,如果不存在,则所述待关联 P0I数据与该目标P0I数据的类型相似度等于预置的中类相似度,如果存在,则判断待关联 P0I数据与目标P0I数据的类型中的大类是否相同,如果大类不相同,则所述待关联P0I数 据与该目标P0I数据的类型相似度等于预置的联合相似度,如果大类相同,则判断二者类 型中的中类是否相同,如果中类不同或者中类为未知,则所述待关联P0I数据与该目标P0I 数据的类型相似度等于预置的大类权值,如果中类相同,则判断二者类型中的小类是否相 同,如果小类不同或者小类为未知,则所述待关联P0I数据与该目标P0I数据的类型相似度 等于预置的中类权值,如果小类相同,则所述待关联POI数据与该目标POI数据的类型相似 度等于预置的小类权值,其中,所述预置的大类权值< 中类权值<小类权值,所述中类相似 度的绝对值与所述中类权值的绝对值相等。
[0036] 优选的,所述地址相似度确定模块具体用于:若所述待关联P0I数据的地址及地 理坐标均为已知,则根据待关联P0I数据的地址与该目标P0I数据的地址,确定第一地址相 似度;对待关联P0I数据的地理坐标进行逆地理编码,得到转换地址;根据待关联P0I数据 的转换地址与该目标P0I数据的地址,确定第二地址相似度;从所述第一地址相似度和第 二地址相似度中,选择最大的一个相似度作为待关联P0I数据与该目标P0I数据的地址相 似度;若所述待关联P0I数据中地址为未知,地理坐标为已知,则对待关联P0I数据的地理 坐标进行逆地理编码,得到转换地址;根据待关联P0I数据的转换地址与该目标P0I数据 的地址,得到待关联P0I数据与该目标P0I数据的地址相似度;若所述待关联P0I数据中地 址为已知,地理坐标为未知,则根据待关联P0I数据的地址与该目标P0I数据的地址,得到 待关联P0I数据与该目标P0I数据的地址相似度。由上可见,将上述第一地址相似度和第 二地址相似度中较大的相似度作为最终的地址相似度,可以避免待关联信息的地址存在误 差,导致根据地址确定出的地址相似度存在较大误差的情况,从而进一步提高了P0I数据 关联的关联精度。
[0037] 优选的,所述地址至少包括:道路名称和门牌号两个字段,则所述地址相似度确定 模块具体用于:判断待关联P0I数据与目标P0I数据的地址中的道路名称是否相同,如果 不相同,则所述待关联P0I数据与该目标P0I数据的地址相似度等于预置的地址相似度值, 如果相同,则判断二者地址中的门牌是否相同,如果不同,则所述待关联P0I数据与该目标 P0I数据的地址相似度等于预置的道路名称权值,如果相同,则所述待关联P0I数据与该目 标P0I数据的地址相似度等于预置的门牌权值,其中,所述道路名称权值 < 门牌权值。
[0038] 优选的,所述名称相似度确定模块,具体用于从待关联P0I数据的名称的分词中, 获取与目标P0I数据的名称的分词相同的分词;将获取出的分词的角色类型对应的权值累 力口,得到待关联P0I数据与该目标P0I数据的名称相似度;若未获取到相同的分词,则待关 联P0I数据与该目标P0I数据的名称相似度等于预置的名称相似度值。由上可见,根据待 关联P0I数据的名称对应的各分词的角色类型确定待关联P0I数据与目标P0I数据之间的 名称相似度,那么确定出的名称相似度就能够表征待关联P0I数据的名称中,各个组成部 分对P0I相似度的贡献,提高了P0I数据关联的关联精度。
[0039]优选的,所述地理距离确定模块具体用于:若所述待关联P0I数据的地理坐标和 地址均为已知,则根据待关联P0I数据的地理坐标与该目标P0I数据的地理坐标,得到第一 地理距离;对待关联P0I数据的地址进行逆地理编码,得到转换地理坐标;根据待关联P0I 数据的转换地理坐标与该目标P0I数据的地理坐标,得到第二地理距离;从所述第一地理 距离和第二地理距离中,选择距离最小的一个地理距离作为待关联P0I数据与该目标P0I 数据之间的地理距离;若所述目标P0I数据的地址已知,地理坐标未知,则对待关联P0I数 据的地址进行逆地理编码,得到转换地理坐标;根据待关联P0I数据的转换地理坐标与该 目标P0I数据的地理坐标,得到待关联P0I数据与该目标P0I数据的地理距离;若所述目标 P0I数据的地址未知,地理坐标已知,则根据待关联P0I数据的地理坐标与该目标P0I数据 的地理坐标,得到待关联P0I数据与该目标P0I数据的地理距离。由上可见,将上述第一地 理距离和第二地理距离中较小的地理距离作为最终的地理距离,可以避免待关联POI数据 的地理坐标存在误差,导致根据地理坐标确定出的地理距离存在较大误差的情况,从而进 一步提_了P0I数据关联的关联精度。
[0040] 优选的,所述P0I相似度确定模块,具体用于将所述类型相似度、地址相似度、名 称相似度累加,得到第一联合相似度;根据预置的地理距离范围与相似度调整值的对应关 系,得到所述地理距离所在的地理距离范围对应的相似度调整值;将所述第一联合相似度 与所述相似度调整值累加,得到待关联P0I数据与该目标P0I数据的P0I相似度。由上可 见,待关联P0I数据与目标P0I数据之间的P0I相似度是根据类型相似度、地址相似度、名 称相似度以及地理距离确定出的,因此P0I相似度能够反映待关联P0I数据和目标P0I数 据针对各属性信息的相关性,即使待关联P0I数据的某一属性信息存在误差,也能综合考 虑其他属性信息,根据P0I相似度确定出关联的P0I数据,因此提高了P0I数据关联的关联 精度。
[0041] 优选的,所述数据确定单元具体用于:将各目标P0I数据按照相似度由高到低的 顺序进行排序,若存在相似度相同的目标P0I数据,则将相似度相同的目标P0I数据按照 地理距离由小到大的顺序进行排序;根据预置的P0I相似度范围与关联精度等级的对应关 系,得到各目标P0I数据的P0I相似度所在的P0I相似度范围对应的关联精度等级,其中, 关联精度等级包含闻精度关联、较闻精度关联、中等精度关联和不关联;判断是否存在关 联精度等级为高精度关联的目标P0I数据,如果存在,则将关联精度等级为高精度关联的 目标P0I数据中,排在第一位的目标P0I数据确定为所述待关联P0I数据
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1