兴趣点数据关联方法及装置的制造方法_5

文档序号:8258519阅读:来源:国知局
特征在于,从获取到的目标POI数据中,确定与所述待 关联POI数据关联的目标POI数据之前,所述方法进一步包括: 基于向量空间模型,确定所述搜索关键词与获取到的各目标POI数据之间的文本匹配 度; 按照文本匹配度由大到小的顺序,对获取到的各目标POI数据进行排序; 在排序后的各目标POI数据中,按照文本匹配度由大到小的顺序获取预置数目个目标 POI数据; 所述从获取到的目标POI数据中,确定与所述待关联POI数据关联的目标POI数据具 体为: 从获取到的预置数目个目标POI数据中,确定与所述待关联POI数据关联的目标POI 数据。
4. 如权利要求1-3中任一权利要求所述的方法,其特征在于,所述预设的角色类型包 含:行政区划、主名称、特定品牌名称、修饰词、行业词、后缀词; 所述按照预设的角色类型优先级顺序,从各分词中选择角色类型与预设的角色类型相 同且优先级最高的分词作为搜索关键词具体包括: 当存在角色类型为主名称的分词时,则从各分词中,选择角色类型为主名称的分词作 为搜索关键词,结束流程;否则, 当不存在角色类型为行政区划的分词时,则按照特定品牌名称、修饰词、行业词、后缀 词优先级由高到低的顺序,从各分词中选择角色类型与特定品牌名称、修饰词、行业词或后 缀词相同且优先级最高的分词作为搜索关键词; 当存在角色类型为行政区划的分词时,则按照特定品牌名称、修饰词、行业词、后缀词 优先级由高到低的顺序,从各分词中选择角色类型与特定品牌名称、修饰词、行业词或后缀 词相同且优先级最高的分词和角色类型为行政区划的分词的组合作为搜索关键词。
5. 如权利要求1-3中任一权利要求所述的方法,其特征在于,所述确定与所述待关联 POI数据关联的目标POI数据具体包括: 根据待关联P0I数据与各获取到的目标P0I数据的属性信息,确定待关联P0I数据与 各获取到的目标P0I数据的P0I相似度; 根据各目标P0I数据的P0I相似度,确定与待关联P0I数据关联的目标P0I数据。
6. 如权利要求5所述的方法,其特征在于,若P0I数据的属性包含名称、类型、地址、地 理坐标,则所述根据待关联P0I数据与获取到的目标P0I数据的属性信息,确定待关联P0I 数据与各获取到的目标P0I数据的P0I相似度,具体包括: 根据待关联P0I数据与目标P0I数据的类型,确定待关联P0I数据与该目标P0I数据 的类型相似度; 根据待关联P0I数据的地址与该目标P0I数据的地址和/或地理坐标,确定待关联P0I 数据与该目标P0I数据的地址相似度; 根据待关联P0I数据与该目标P0I数据的名称,确定待关联P0I数据与该目标P0I数 据的名称相似度; 根据待关联P0I数据的地理坐标与该目标P0I数据的地理坐标和/或地址,确定待关 联P0I数据与该目标P0I数据的地理距离; 根据所述类型相似度、地址相似度、名称相似度W及地理距离,确定待关联P0I数据与 该目标P0I数据的P0I相似度。
7. 如权利要求6所述的方法,其特征在于,若所述类型包括大类、中类及小类H个字 段,则所述根据待关联P0I数据与目标P0I数据的类型,确定待关联P0I数据与该目标P0I 数据的类型相似度具体包括: 判断待关联P0I数据中是否存在类型该一属性信息,如果不存在,则所述待关联P0I数 据与该目标P0I数据的类型相似度等于预置的中类相似度,如果存在,则判断待关联P0I数 据与目标P0I数据的类型中的大类是否相同,如果大类不相同,则所述待关联P0I数据与该 目标P0I数据的类型相似度等于预置的联合相似度,如果大类相同,则判断二者类型中的 中类是否相同,如果中类不同或者中类为未知,则所述待关联P0I数据与该目标P0I数据的 类型相似度等于预置的大类权值,如果中类相同,则判断二者类型中的小类是否相同,如果 小类不同或者小类为未知,则所述待关联P0I数据与该目标P0I数据的类型相似度等于预 置的中类权值,如果小类相同,则所述待关联P0I数据与该目标P0I数据的类型相似度等于 预置的小类权值,其中,所述预置的大类权值< 中类权值<小类权值,所述中类相似度的绝 对值与所述中类权值的绝对值相等。
8. 如权利要求6所述的方法,其特征在于,所述根据待关联P0I数据的地址与该目标 P0I数据的地址和/或地理坐标,确定待关联P0I数据与该目标P0I数据的地址相似度,具 体包括: 若所述待关联P0I数据的地址及地理坐标均为已知,则根据待关联P0I数据的地址与 该目标P0I数据的地址,确定第一地址相似度;对待关联P0I数据的地理坐标进行逆地理编 码,得到转换地址;根据待关联P0I数据的转换地址与该目标P0I数据的地址,确定第二地 址相似度;从所述第一地址相似度和第二地址相似度中,选择最大的一个相似度作为待关 联P0I数据与该目标P0I数据的地址相似度; 若所述待关联P0I数据中地址为未知,地理坐标为已知,则对待关联P0I数据的地理坐 标进行逆地理编码,得到转换地址;根据待关联POI数据的转换地址与该目标POI数据的地 址,得到待关联P0I数据与该目标P0I数据的地址相似度; 若所述待关联P0I数据中地址为已知,地理坐标为未知,则根据待关联P0I数据的地址 与该目标P0I数据的地址,得到待关联P0I数据与该目标P0I数据的地址相似度。
9. 如权利要求8所述的方法,其特征在于,所述地址至少包括:道路名称和口牌号两个 字段,则所述根据待关联P0I数据的地址与该目标P0I数据的地址,得到待关联P0I数据与 该目标P0I数据的地址相似度,具体包括: 判断待关联P0I数据与目标P0I数据的地址中的道路名称是否相同,如果不相同,则所 述待关联P0I数据与该目标P0I数据的地址相似度等于预置的地址相似度值,如果相同,贝U 判断二者地址中的口牌是否相同,如果不同,则所述待关联P0I数据与该目标P0I数据的地 址相似度等于预置的道路名称权值,如果相同,则所述待关联P0I数据与该目标P0I数据的 地址相似度等于预置的口牌权值,其中,所述道路名称权值< 口牌权值。
10. 如权利要求6所述的方法,其特征在于,根据待关联P0I数据与该目标P0I数据的 名称,确定待关联P0I数据与该目标P0I数据的名称相似度,具体包括: 从待关联P0I数据的名称的分词中,获取与目标P0I数据的名称的分词相同的分词; 将获取出的分词的角色类型对应的权值累加,得到待关联P0I数据与该目标P0I数据 的名称相似度; 若未获取到相同的分词,则待关联P0I数据与该目标P0I数据的名称相似度等于预置 的名称相似度值。
11. 如权利要求6所述的方法,其特征在于,根据待关联P0I数据的地理坐标与该目标 P0I数据的地理坐标和/或地址,确定待关联P0I数据与该目标P0I数据的地理距离,具体 包括: 若所述待关联P0I数据的地理坐标和地址均为已知,则根据待关联P0I数据的地理坐 标与该目标P0I数据的地理坐标,得到第一地理距离;对待关联P0I数据的地址进行逆地理 编码,得到转换地理坐标;根据待关联P0I数据的转换地理坐标与该目标P0I数据的地理坐 标,得到第二地理距离;从所述第一地理距离和第二地理距离中,选择距离最小的一个地理 距离作为待关联P0I数据与该目标P0I数据之间的地理距离; 若所述目标P0I数据的地址已知,地理坐标未知,则对待关联P0I数据的地址进行逆地 理编码,得到转换地理坐标;根据待关联P0I数据的转换地理坐标与该目标P0I数据的地理 坐标,得到待关联P0I数据与该目标P0I数据的地理距离; 若所述目标P0I数据的地址未知,地理坐标已知,则根据待关联P0I数据的地理坐标与 该目标P0I数据的地理坐标,得到待关联P0I数据与该目标P0I数据的地理距离。
12. 如权利要求6所述的方法,其特征在于,根据所述类型相似度、地址相似度、名称相 似度W及地理距离,确定待关联P0I数据与该目标P0I数据的P0I相似度,具体包括: 将所述类型相似度、地址相似度、名称相似度累加,得到第一联合相似度; 根据预置的地理距离范围与相似度调整值的对应关系,得到所述地理距离所在的地理 距离范围对应的相似度调整值; 将所述第一联合相似度与所述相似度调整值累加,得到待关联P0I数据与该目标P0I 数据的P0I相似度。
13. 如权利要求12所述的方法,其特征在于,所述根据各目标POI数据的POI相似度, 确定与待关联P0I数据关联的目标P0I数据具体包括: 将各目标P0I数据按照相似度由高到低的顺序进行排序,若存在相似度相同的目标 P0I数据,则将相似度相同的目标P0I数据按照地理距离由小到大的顺序进行排序; 根据预置的P0I相似度范围与关联精度等级的对应关系,得到各目标P0I数据的P0I 相似度所在的P0I相似度范围对应的关联精度等级,其中,关联精度等级包含高精度关联、 较高精度关联、中等精度关联和不关联; 判断是否存在关联精度等级为高精度关联的目标P0I数据,如果存在,则将关联精度 等级为高精度关联的目标P0I数据中,排在第一位的目标P0I数据确定为所述待关联P0I 数据关联的目标P0I数据,如果不存在,则判断是否存在关联精度等级为较高精度关联的 目标P0I数据,如果存在,则将关联精度等级为较高精度关联的各目标P0I数据中,排在第 一位的目标P0I数据确定为所述待关联P0I数据关联的目标P0I数据,如果不存在,则判断 是否存在关联精度等级为中等精度关联的目标P0I数据,如果存在,则返回关联精度等级 为中等精度关联的各目标P0I数据,如果不存在,则结束流程。
14. 一种兴趣点数据关联装置,其特征在于,包括: 分词处理单元,用于将待关联兴趣点P0I数据的名称进行分词处理,得到组成所述名 称的分词; 角色标注单元,用于对各分词进行角色标注,得到各分词的角色类型; 搜索关键词选择单元,用于按照预设的角色类型优先级顺序,从各分词中选择角色类 型与预设的角色类型相同且优先级最高的分词作为搜索关键词; 第一数据获取单元,用于从目标P0I数据库中,获取名称中包含所述搜索关键词的目 标P0I数据; 数据确定单元,用于从第一数据获取单元获取到的目标P0I数据中,确定与所述待关 联P0I数据关联的目标P0I数据。
15. 如权利要求14所述的装置,其特征在于,还包括: 第二数据获取单元,用于在数据确定单元从第一数据获取单
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1