兴趣点数据关联方法及装置的制作方法

文档序号:6575217阅读:171来源:国知局
专利名称:兴趣点数据关联方法及装置的制作方法
技术领域
本发明涉 及信息处理技术领域,尤其涉及一种兴趣点数据关联方法及装置。
背景技术
目前,在地理信息系统(Geographic Information System,GIS)中,兴趣点(Point Of Interest,P0I)的采集方式主要有实地采集,互联网采集等。由于采集POI数据时,采 集人员并不会考虑该POI数据是否已被采集过,因此,造成不同批次采集的POI数据之间存 在很多重复的POI数据。在对现有技术的研究和实践过程中,发明人发现由于重复POI数据的存在,使POI 数据的应用出现了一些问题。比如,在某网站提供的电子地图服务中以“赛迪”为关键词查 找与之相关的POI数据,电子地图显示的POI数据查询结果中,在复兴路有两个距离很近的 “赛迪咨询顾问公司”和“赛迪资讯顾问有限公司”,虽然这两个POI数据的名称不完全相同, 但它们的地址都是“海淀区复兴路戊12号”,这两个POI数据属于重复数据,这样的查询结 果很容易使用户产生误解。因此,发明人认为目前亟需提供一种能够将相同POI数据关联 在一起的技术,以便有效地解决POI数据重复的问题,使POI数据的应用更为完美。

发明内容
本发明实施例要解决的技术问题是提供一种能够关联出相同兴趣点关联的兴趣 点数据关联方法及装置。为解决上述技术问题,本发明的目的是通过以下技术方案实现的本发明实施例提供了一种兴趣点数据关联方法,该方法包括读取一条待关联兴趣点数据;对所述待关联兴趣点数据的属性进行处理,得到新的待关联兴趣点数据;从预置的目标关联兴趣点数据集中,获取所述新的待关联兴趣点数据的目标关联 兴趣点数据子集;用所述新的待关联兴趣点数据的属性与所述目标关联兴趣点数据子集中兴趣点 数据的属性进行比较,得到相同的兴趣点数据。相应地,本发明实施例还提供了一种兴趣点数据关联装置,该装置包括数据读取单元,用于读取一条待关联兴趣点数据;数据处理单元,用于对所述待关联兴趣点数据的属性进行处理,得到新的待关联 兴趣点数据;数据子集获取单元,用于从预置的目标关联兴趣点数据集中,获取所述新的待关 联兴趣点数据的目标关联兴趣点数据子集;数据关联单元,用于用所述新的待关联兴趣点数据的属性与所述目标关联兴趣点 数据子集中兴趣点数据的属性进行比较,若满足预设的关联条件,则将新的待关联兴趣点 数据与目标关联兴趣点数据标记为相同的兴趣点数据。
上述技术方案具有如下有益效果本发明提供的兴趣点数据关联方法,该方法对待关联POI数据的属性进行处理, 得到新的待关联POI数据,从预置的目标关联POI数据集中,获取新的待关联POI数据的目 标关联POI数据子集,通过将新的待关联POI数据的属性与目标关联POI数据子集中POI 数据的属性进行比较,得到相同的POI数据,有效地解决POI数据重复的问题


图1为本发明实施例提供的POI数据关联方法流程图;图2为本发明实施例提供的待关联POI数据的属性处理过程示意图;图3为本发明实施例提供的对待关联POI数据的名称进行处理的方法流程图;图4为本发明实施例提供的对待关联POI数据的地址进行处理的方法流程图;图5为本发明实施例提供的对待关联POI数据的坐标进行处理的方法流程图;图6为本发明实施例提供的第一种划定关联范围的方法流程图;图7为本发明实施例提供的第二种划定关联范围的方法流程图;图8为本发明实施例提供的第三种划定关联范围的方法流程图;图9为本发明实施例提供的第一种在划定关联范围进行POI关联的方法流程图;图10为本发明实施例提供的第二种在划定关联范围进行POI关联的方法流程 图;图11为本发明实施例提供的第三种在划定关联范围进行POI关联的方法流程 图;图12为本发明实施例提供的兴趣点数据关联装置组成示意图。
具体实施例方式为使本发明实施例的目的、技术方案、及优点更加清楚明白,以下参照附图对本发 明实施例提供的技术方案进行详细说明。请参见图1,为本发明实施例提供的POI数据关联方法流程图,该方法包括步骤101 从待关联POI数据集中读取一条待关联POI数据;步骤102 对该待关联POI数据的属性进行处理,得到新的待关联POI数据;步骤103 从预置的目标关联POI数据集中,获取新的待关联POI数据的目标关联 POI数据子集;在本发明实施例中,目标关联POI数据的属性预先进行过处理,处理方法与本发 明实施例提供的对待关联POI数据的处理方法基本相同。步骤104 将新的待关联POI数据的属性与目标关联POI数据子集中POI数据的 属性进行比较,若满足预设的关联条件,则进入步骤105,否则,进入步骤106 步骤105 将新的待关联POI数据与满足关联条件的目标关联POI数据标记为相 同的POI数据;步骤106 判断待关联POI数据集中是否还有待关联POI数据,如果有,则返回步 骤101,如果没有,则结束该关联流程。以上为本发明实施例提供的POI数据关联方法,该方法对待关联POI数据的属性进行处理,得到新的待关联POI数据,从预置的目标关联POI数据集中,获取新的待关联POI 数据的目标关联POI数据子集,通过将新的待关联POI数据的属性与目标关联POI数据子 集中POI数据的属性进行比较,得到相同的POI数据,有效地解决POI数据重复的问题。请参见图2,为本发明实施例提供的待关联POI数据的属性处理过程示意图,该过 程包括对待关联POI数据的 名称进行处理,得到至少一条新的待关联POI数据的名称处 理过程201 ;对待关联POI数据的地址进行处理,得到至少一条新的待关联POI数据的地址处 理过程202 ;对待关联POI数据的坐标进行处理,得到至少一条新的待关联POI数据的坐标处 理过程203 ;其中,上述三个处理过程是三个相互独立的处理过程,在实际应用中,这三个处理 过程可以同时进行,也可以不同时进行,并不影响本发明实施例的实现。以下结合附图,对本发明实施例提供的待关联POI数据的属性处理过程进行详细 介绍。请参见图3,为本发明实施例提供的对待关联POI数据的名称进行处理的方法流 程图,该方法包括步骤301 判断待关联POI数据的名称是否以括号为结尾,如果不是,则进入步骤 303,如果是,则进入步骤302 步骤302 删除名称中的括号及括号内的字符;比如,“海龙大厦(中关村大街)”处理以后将变成“海龙大厦”。步骤303 判断名称是否以预置的行政区划表中的行政区划为前缀,如果是,则进 入步骤304,如果不是,则进入步骤306 ;表1为本发明实施例提供的行政区划表示例,行政区划表用于记录城市的名称及 其区县名称。
权利要求
一种兴趣点数据关联方法,其特征在于,包括读取一条待关联兴趣点数据;对所述待关联兴趣点数据的属性进行处理,得到新的待关联兴趣点数据;从预置的目标关联兴趣点数据集中,获取所述新的待关联兴趣点数据的目标关联兴趣点数据子集;用所述新的待关联兴趣点数据的属性与所述目标关联兴趣点数据子集中兴趣点数据的属性进行比较,得到相同的兴趣点数据。
2.如权利要求1所述的兴趣点数据关联方法,其特征在于,对所述待关联兴趣点数据 的属性进行处理,得到新的待关联兴趣点数据具体包括对所述待关联兴趣点数据的名称进行处理,得到至少一条新的待关联兴趣点数据; 对所述待关联兴趣点数据的地址进行处理,得到至少一条新的待关联兴趣点数据; 对所述待关联兴趣点数据的坐标进行处理,得到至少一条新的待关联兴趣点数据。
3.如权利要求2所述的兴趣点数据关联方法,其特征在于,所述对待关联兴趣点数据 的名称进行处理,得到至少一条新的待关联兴趣点数据具体包括判断待关联兴趣点数据的名称是否以括号为结尾,如果是,则删除名称中的括号及括 号内的字符;判断名称是否以预置的行政区划表中的行政区划为前缀,如果是,则判断前缀相邻的 词是否为预置的后缀表中的词,如果不是,则删除名称的前缀;判断名称是否以后缀表中的词为后缀,如果是,则判断后缀相邻的词是否为行政区划 表中的词,如果否,则删除名称的后缀;判断名称中的词在预置的同义词表中是否有对应的同义词,如果有,则将名称中的词 用同义词替换,得到新名称,用所述新名称与所述待关联兴趣点数据的其他字段构成新的 待关联兴趣点数据;判断名称是否包含预置的连锁店表中的连锁店名称,如果包含,则用所述连锁店名称 与待关联兴趣点数据的其他字段构成新的待关联兴趣点数据。
4.如权利要求3所述的兴趣点数据关联方法,其特征在于,对所述待关联兴趣点数据 的地址进行处理,得到至少一条新的待关联兴趣点数据具体包括判断所述待关联兴趣点数据的地址中是否以预置的行政区划表中的行政区划为前缀, 如果是,则删除地址中的行政区划;在地址中从左至右查找数字,若第一个查找到的数字没有位于地址的首位,则删除地 址中所述数字及其右侧的字符,若所述数字左侧的字符为天干和/或特殊符号,则从地址 中删除所述天干和/或特殊符号;判断地址中的词在预置的同义词表中是否有对应的同义词,如果有,则将地址中的词 用同义词替换,得到新地址,用所述新地址与待关联兴趣点数据的其他字段构成新的待关 联兴趣点数据;判断地址中是否包含预置路名表中的道路名称,如果是,则用所述道路名称与待关联 兴趣点数据的其他字段构成新的待关联兴趣点数据。
5.如权利要求4所述的兴趣点数据关联方法,其特征在于,对所述待关联兴趣点数据 的坐标进行处理,得到至少一条新的待关联兴趣点数据具体包括CN 101963962 A 从所述待关联兴趣点数据中提取坐标经纬度; 将所述坐标经纬度拆分为经度坐标χΟ和纬度坐标y0 ;用经度坐标xO和纬度坐标y0与待关联兴趣点数据的其他字段构成新的待关联兴趣点 数据。
6.如权利要求5所述的兴趣点数据关联方法,从预置的目标关联兴趣点数据集中,获 取所述新的待关联兴趣点数据的目标关联兴趣点数据子集具体包括将新的待关联兴趣点数据的经度坐标xO和纬度坐标y0代入 ry = (y0*π)/180. 0/3600000. 0sx 二 sin(---)V 1000.0*2.0xl = arcos(卜2灯2 7Sm ( 7))/(π/\80.0/3600000.0) cos (ry)—S(l-2灯:))·000.0,计算得到χ 和yi,其中,r为地球半径,s为关联距罔;在预置的目标关联兴趣点数据集中,选择经度坐标大于xO-xl,小于xO+xl,且纬度坐 标大于y0-yl,小于y0+yl的目标关联兴趣点数据构成目标关联兴趣点数据子集。
7.如权利要求5所述的兴趣点数据关联方法,其特征在于,若所述待关联兴趣点数据 的类型准确,则从预置的目标关联兴趣点数据集中,获取与所述新的待关联兴趣点数据的 目标关联兴趣点数据子集具体包括从所述新的待关联数据中提取类型代码;在预置的类型规则配置表中,查找所述类型代码对应的经度坐标xl和纬度坐标yl ; 在预置的目标关联兴趣点数据集中,选择经度坐标大于xO-xl,小于xO+xl,且纬度坐 标大于y0-yl,小于y0+yl的目标关联兴趣点数据构成目标关联兴趣点数据子集。
8.如权利要求5所述的兴趣点数据关联方法,其特征在于,从预置的目标关联兴趣点 数据集中,获取与所述新的待关联兴趣点数据的目标关联兴趣点数据子集具体包括第一步从新的待关联兴趣点数据的地址的第j位开始取出i个字符; 其中,i的初始值为兴趣点数据地址的长度值,j的初始值为0 ; 第二步判断预置的目标关联兴趣点数据集中是否有目标关联兴趣点数据的地址与所 述i个字符匹配,如果有,则进入第三步,如果没有,则进入第四步;第三步将目标关联兴趣点数据加入所述新的待关联兴趣点数据的目标关联兴趣点数 据子集中;第四步判断j是否大于地址的长度减去i,如果小于,则j = j+1,并返回第一步,如果 大于,则进入第五步;第五步判断i是否小于1,如果小于1,则结束,如果大于1,则i = i_l,j = 0,返回第“■步 ο
9.如权利要求6或7或8所述的兴趣点数据关联方法,其特征在于,所述将新的待关联 兴趣点数据的属性与所述目标关联兴趣点数据子集中兴趣点数据的属性进行比较,得到相 同的兴趣点数据具体包括将新的待关联兴趣点数据的名称与目标关联兴趣点数据子集中兴趣点数据的名称进 行比较,若两个名称有末端对齐的包含关系,则将新的待关联兴趣点数据与目标关联兴趣 点数据标记为相同的兴趣点数据。
10.如权利要求7所述的兴趣点数据关联方法,其特征在于,所述将新的待关联兴趣点 数据的属性与所述目标关联兴趣点数据子集中兴趣点数据的属性进行比较,得到相同的兴 趣点数据具体包括将所述新的待关联兴趣点数据的类型代码与所述目标关联兴趣点数据子集中的兴趣 点数据的类型代码进行比较,若两个类型代码一致,则将新的待关联兴趣点数据与目标关 联兴趣点数据标记为相同的兴趣点数据。
11.如权利要求7所述的兴趣点数据关联方法,其特征在于,所述将新的待关联兴趣点 数据的属性与所述目标关联兴趣点数据子集中兴趣点数据的属性进行比较,得到相同的兴 趣点数据具体包括将所述新的待关联兴趣点数据的名称与所述目标关联兴趣点数据子集中的兴趣点数 据的名称进行比较,若两个名称完全一致,则将两个兴趣点数据的类型代码进行比较,若两 个类型代码一致,则将新的待关联兴趣点数据与目标关联兴趣点数据标记为相同的兴趣点 数据。
12.一种兴趣点数据关联装置,其特征在于,包括数据读取单元,用于读取一条待关联兴趣点数据;数据处理单元,用于对所述待关联兴趣点数据的属性进行处理,得到新的待关联兴趣 点数据;数据子集获取单元,用于从预置的目标关联兴趣点数据集中,获取所述新的待关联兴 趣点数据的目标关联兴趣点数据子集;数据关联单元,用于用所述新的待关联兴趣点数据的属性与所述目标关联兴趣点数据 子集中兴趣点数据的属性进行比较,若满足预设的关联条件,则将新的待关联兴趣点数据 与目标关联兴趣点数据标记为相同的兴趣点数据。
13.如权利要求12所述的兴趣点数据关联装置,其特征在于,所述数据处理单元具体 包括数据名称处理单元,对所述待关联兴趣点数据的名称进行处理,得到至少一条新的待 关联兴趣点数据;数据地址处理单元,对所述待关联兴趣点数据的地址进行处理,得到至少一条新的待 关联兴趣点数据;数据坐标处理单元,对所述待关联兴趣点数据的坐标进行处理,得到至少一条新的待 关联兴趣点数据。
14.如权利要求13所述的兴趣点数据关联装置,其特征在于,所述数据名称处理单元 具体包括括号处理单元,用于判断待关联兴趣点数据的名称是否以括号为结尾,如果是,则删除 名称中的括号及括号内的字符;名称前缀处理单元,用于判断经过所述括号处理单元处理的名称是否以预置的行政区 划表中的行政区划为前缀,如果是,则判断前缀相邻的词是否为预置的后缀表中的词,如果不是,则删除名称的前缀;名称后缀处理单元,用于判断经过所述名称前缀处理单元处理的名称是否以后缀表中 的词为后缀,如果是,则判断后缀相邻的词是否为行政区划表中的词,如果否,则删除名称 的后缀;名称同义词处理单元,用于判断经过所述名称后缀处理单元处理的名称中的词在预置 的同义词表中是否有对应的同义词,如果有,则将名称中的词用同义词替换,得到新名称, 用所述新名称与所述待关联兴趣点数据的其他字段构成新的待关联兴趣点数据;连锁店处理单元,用判断经过所述名称同义词处理单元处理的名称是否包含预置的连 锁店表中的连锁店名称,如果包含,则用所述连锁店名称与待关联兴趣点数据的其他字段 构成新的待关联兴趣点数据。
15.如权利要求14所述的兴趣点数据关联装置,其特征在于,所述数据地址处理单元 具体包括地址前缀处理单元,用于判断所述待关联兴趣点数据的地址中是否以预置的行政区划 表中的行政区划为前缀,如果是,则删除地址中的行政区划;数字处理单元,用于在经过所述地址前缀处理单元处理的地址中从左至右查找数字, 若第一个查找到的数字没有位于地址的首位,则删除地址中所述数字及其右侧的字符,若 所述数字左侧的字符为天干和/或特殊符号,则从地址中删除所述天干和/或特殊符号;地址同义词处理单元,用于判断经过所述数字处理单元处理的地址中的词在预置的同 义词表中是否有对应的同义词,如果有,则将地址中的词用同义词替换,得到新地址,用所 述新地址与待关联兴趣点数据的其他字段构成新的待关联兴趣点数据;道路名称处理单元,用于判断经过所述地址同义词处理单元处理的地址中是否包含预 置路名表中的道路名称,如果是,则用所述道路名称与待关联兴趣点数据的其他字段构成 新的待关联兴趣点数据。
16.如权利要求15所述的兴趣点数据关联装置,其特征在于,所述数据坐标处理单元 具体包括坐标提取单元,用于从所述待关联兴趣点数据中提取坐标经纬度; 坐标处理单元,用于将所述坐标提取单元提取的坐标经纬度拆分为经度坐标xO和纬 度坐标y0,并用经度坐标xO和纬度坐标y0与待关联兴趣点数据的其他字段构成新的待关 联兴趣点数据。
17.如权利要求16所述的兴趣点数据关联装置,其特征在于,所述数据子集获取单元 具体包括坐标计算单元,用于将新的待关联兴趣点数据的经度坐标xO和纬度坐标y0代入 ry = (y0*π)/180. 0/3600000. 0sx = sin(---)r*1000.0*2.0jcl 二 ar/(π/\80.0 / 3600000.0)cos (ry)yl = (flrcos(l-25x2))*3600000.0 ,计算得到χ1和yl,其中,r为地球半径,s为关联距 ^■/1805罔;目标关联数据子集获取单元,用于在预置的目标关联兴趣点数据集中,选择经度坐标 大于xO-xl,小于xO+xl,且纬度坐标大于yO-yl,小于yO+yl的目标关联兴趣点数据构成目 标关联兴趣点数据子集。
18.如权利要求16所述的兴趣点数据关联装置,其特征在于,若所述待关联兴趣点数 据的类型准确,则所述数据子集获取单元具体包括类型代码提取单元,用于从所述新的待关联数据中提取类型代码;坐标查询单元,用于在预置的类型规则配置表中,查找所述类型代码对应的经度坐标 Xl和纬度坐标yl ;目标关联数据子集获取单元,用于在预置的目标关联兴趣点数据集中,选择经度坐标 大于xO-xl,小于xO+xl,且纬度坐标大于yO-yl,小于yO+yl的目标关联兴趣点数据构成目 标关联兴趣点数据子集。
19.如权利要求16所述的兴趣点数据关联装置,其特征在于,所述数据子集获取具体 包括字符获取单元,用于从新的待关联兴趣点数据的地址的第j位开始取出i个字符;其中,i的初始值为兴趣点数据地址的长度值,j的初始值为0 ;地址匹配单元,用于判断预置的目标关联兴趣点数据集中是否有目标关联兴趣点数据 的地址与所述i个字符匹配,如果有,则目标关联数据添加单元,如果没有,则触发第一状 态判断单元;目标关联数据添加单元,用于将目标关联兴趣点数据加入所述新的待关联兴趣点数据 的目标关联兴趣点数据子集中;第一状态判断单元,用于判断j是否大于地址的长度减去i,如果小于,则j = j+1,并 触发所述字符获取单元,如果大于,则触发第二状态判断单元;第二状态判断单元,用于判断i是否小于1,如果小于1,则结束,如果大于1,则i = i-1,j = 0,触发所述字符获取单元。
20.如权利要求17或18或19所述的兴趣点数据关联装置,其特征在于,所述数据关联 单元具体为末端对齐数据关联单元所述末端对齐数据关联单元,用于将新的待关联兴趣点数据的名称与目标关联兴趣点 数据子集中兴趣点数据的名称进行比较,若两个名称有末端对齐的包含关系,则将新的待 关联兴趣点数据与目标关联兴趣点数据标记为相同的兴趣点数据。
21.如权利要求18所述的兴趣点数据关联装置,其特征在于,所述数据关联单元具体 为类型一致数据关联单元所述类型一致数据关联单元,用于将所述新的待关联兴趣点数据的类型代码与所述目 标关联兴趣点数据子集中的兴趣点数据的类型代码进行比较,若两个类型代码一致,则将 新的待关联兴趣点数据与目标关联兴趣点数据标记为相同的兴趣点数据。
22.如权利要求18所述的兴趣点数据关联装置,其特征在于,所述数据关联单元具体 包括名称一致数据关联单元,用于将所述新的待关联兴趣点数据的名称与所述目标关联兴 趣点数据子集中的兴趣点数据的名称进行比较,若两个名称完全一致,则触发类型一致数据关联单元;所述类型一致数据关联单元,用于将两个兴趣点数据的类型代码进行比较,若两个类 型代码一致,则将新的待关联兴趣点数据与目标关联兴趣点数据标记为相同的兴趣点数 据。
全文摘要
本发明实施例提供了一种兴趣点数据关联方法及装置。所述方法包括读取一条待关联兴趣点数据;对所述待关联兴趣点数据的属性进行处理,得到新的待关联兴趣点数据;从预置的目标关联兴趣点数据集中,获取所述新的待关联兴趣点数据的目标关联兴趣点数据子集;用所述新的待关联兴趣点数据的属性与所述目标关联兴趣点数据子集中兴趣点数据的属性进行比较,得到相同的兴趣点数据。相应地,本发明实施例还提供了一种兴趣点数据关联装置。采用本发明实施例提供的方法或者装置可以关联出不同批次兴趣点数据中相同的数据,有效地解决了兴趣点数据重复的问题。
文档编号G06F17/30GK101963962SQ20091008954
公开日2011年2月2日 申请日期2009年7月23日 优先权日2009年7月23日
发明者杨东见, 王涛 申请人:高德软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1