一种兴趣点地址信息处理的方法和装置的制作方法

文档序号:6575205阅读:115来源:国知局
专利名称:一种兴趣点地址信息处理的方法和装置的制作方法
技术领域
本发明涉及一种信息处理技术,尤其涉及一种兴趣点地址信息处理的方法和装置。
背景技术
地理信息系统(GIS,Geographic Information System)是用于采集、存储、管理、 处理、检索、分析和表达地理空间数据的计算机系统,是分析和处理海量地理数据的系统。 地理信息是指直接或间接与地球上的空间位置有关的信息,又称为空间信息。随着科技的进步和数据处理能力的提高,GIS系统所涉及的地理范围正在逐渐的 扩大,从某些城市范围扩大到全国范围,最大的甚至发展到全球范围。随着地理范围的扩 大,其涉及到的数据也随之增大。海量数据的管理和应用已经成为其制约应用到电子地图 服务系统的严重瓶颈。目前在电子地图服务系统中,得到地址名称的途径主要是通过POI (兴趣点,Point of Interest)的采集,POI作为整个电子地图系统的灵魂,占据着主导作用。随着科技的进 步,采集POI的手段日益增多车采、步行PDA采集,电话采集、网络搜索等一系列手段,使得 POI信息的产量愈加丰富,同时降低了采集成本,而且有着利用率高,更新速度快等优点。但 同时,随着POI信息数量的增多,也出现了因POI信息不规范所带来的一系列问题,例如POI 名称混乱,导致POI名称与实地的真实名称不符,从而POI检索困难,电子地图显示混乱,甚 至出现同一个地点会同时存在多个不同的POI名称来表示。

发明内容
本发明的实施例提供了一种兴趣点地址信息处理的方法和装置,可解决现有技术 POI地址信息不规范所带来的问题。本发明的实施例提供了一种兴趣点地址信息处理的方法,包括获取兴趣点地址 信息;根据配置文件对所述兴趣点地址信息进行处理,以获得规范的兴趣点地址信息,所述 配置文件包括兴趣点地址信息规范规则。本发明的实施例还提供了一种兴趣点地址信息处理的装置,包括获取单元,用于 获取兴趣点地址信息;规范单元,用于根据配置文件对所述兴趣点地址信息进行处理,以获 得规范的兴趣点地址信息,所述配置文件包括兴趣点地址信息规范规则。根据本发明实施例,可以将同一 POI地址信息的多种表示进行规范化处理,得到 唯一的规范信息,便于今后处理;这样,当在大比例尺下,可使地图显示的内容不过于繁冗, 同时尽可能多的显示POI地址信息;因此,对政府机关、服务机构等比较严肃的地址信息, 通过该方法进行规范化,减少被投诉的可能性。


图1示出了本发明实施例的兴趣点地址信息处理的流程;
4
图2示出了本发明实施例的根据配置文件对所述兴趣点地址信息进行处理的流 程;图3示出了本发明实施例的兴趣点地址信息处理的装置。
具体实施例方式为了便于本领域一般技术人员理解和实现本发明,现结合附图描绘本发明的实施 例。实施例一本实施例提供了一种兴趣点地址信息处理的方法。该方法包括下列步骤将包含 POI地址名称的源文件进行统一管理放在指定目录下;设置配置文件,所述配置文件包括 大类关键字,其可按行业进行划分;子关键字群,其包括兴趣点地址信息的至少一个关键 字;处理方法群,其包括规范规则,用于根据所述兴趣地址信息的关键字获得所述规范的兴 趣点地址信息。为了提高兴趣点地址信息处理效率,对配置文件进行结构优化处理,即,将 每一条配置信息按优先级进行排序,同时对每一条配置信息赋予相应的ID(身份标识)编 号,所述优先级可按照子关键字群中关键字的数量来确定,即,数量越多,优先级越高;将优 化后的配置信息按照“ID号”、“大类关键字”、“子关键字群”、“处理方法群”的排列方式进行 分类生成配置文件;对源文件中的POI地址名称与配置文件进行匹配,将匹配成功的地址 名称进行相应的规范处理并放入简称列表文件,同时指出处理所用的方法ID和地址名称 所在源文件的位置,这一过程还可筛选出匹配失败的地址名称放入日志文件并指出匹配失 败原因;检查所生成的名称简称无误后,根据所记录的源文件的位置将简称添加到源文件 当中;将软件处理过程中生成各种列表文件或日志文件全部追加到历史日志文件中。下面结合附图和具体实施方式
对本发明做进一步详细的说明图1示出了本发明实施例的一种兴趣点地址信息处理的流程,包括如下步骤步骤101、设置配置文件。配置文件包括兴趣点地址信息规范规则,该规范规则包括大类关键字,其为POI 地址信息所属类别,如可根据行业进行划分的部分POI地址信息;子关键字群,其包括兴趣 点地址信息的至少一个关键字;处理方法群,其包括处理规则,用于根据所述兴趣点地址信 息的关键字获得所述规范的兴趣点地址信息。其中,大类关键字可根据行业进行分类而获得的部分POI地址信息。其作用是判 断地址名称属于哪个大类的名称,例如“银行”、“酒店”等。这样做的好处是,把所有的配置 信息分成多个大类,系统在遍历配置信息之前,只要先遍历大类关键字即可将其中属于其 他大类的所有配置信息忽略,从而降低系统的时间复杂度,同时能够更加提高系统的内存 利用率。子关键字群,其主要作用是在匹配大类关键字成功后,在该大类所属的所有子关 键字群进行匹配,从而确定所需要进行规范变换所使用的方法。子关键字群是由关键字和 特殊分隔符号组成,例如“银行I分理处I取款机”,由三个关键词“银行”、“分理处”、“取款 机”和特殊分隔符号“ I ”组成,这些关键字要求在匹配的地址名称中存在,同时要求关键字 出现的顺序也不能发生改变,这样就可以锁定地址名称信息的结构,为正确的规范处理奠 定了基石。
处理方法群,其主要作用是确定所使用的规范规则,处理方法群中定义了一系列 处理方法,按类型划分分为两种必须处理方法群和临时处理方法群,两种方法的区别在 于,必须处理方法群中方法在子关键字与源文件中的POI地址名称匹配时必须通过,否则 判定为POI地址名称匹配处理失败;临时处理方法群中的方法在进行匹配时不影响整个地 址名称的匹配进程,即方法匹配失败也不会判定整个地址名称匹配处理失败。这样分类的 好处在于可以增加匹配文件设计的灵活性,同时减少匹配文件撰写的工作量。处理方法由若干个处理模式组成,每个处理模式定义了处理操作。根据POI地址信息与小类关键字的匹配方式的不同可分为六种处理模式两个关 键字之间部分的处理模式(简单表示为“关键字1 关键字2 处理操作”),对POI中存在 该两个关键字之间的部分进行处理操作;关键字之前部分的处理模式(简单表示为“ I关键 字处理操作”),对关键字之前的部分进行处理操作;关键字之后部分的处理模式(简单表 示为“关键字I 处理操作”),对关键字之后的部分进行处理操作;关键字本身处理模式(简 单表示为“关键字处理操作”),对关键字本身进行处理操作;括号部分处理模式(简单表 示为“0 处理操作”),对括号之间的部分进行处理操作;整个部分处理模式(简单表示为 “ & A & 处理操作”),将整个地址名称信息作为待转化内容进行操作。处理操作包括转换操作(简单表示为提取的字符串> _转换的目标字符串), 即将所提取的字符串转换为目标字符串;删除操作(简单表示为<d>指定的删除部分,或 <dA>),即删除所提取字符串中指定的删除部分或删除所提取信息的全部内容。在上述处理 模式中,“之前” “之后” “之间”可以包括本关键词(在关键字之后加上“+”:关键字+),也 可以不包括本关键词。步骤102,根据配置文件对所述兴趣点地址信息进行处理,以获得规范的兴趣点地
址f曰息。参照图2,地址名称匹配的步骤主要包括步骤200、读取POI地址名称。步骤201、将POI地址名称与大类关键字进行匹配,并判断POI地址名称中是否包 含大类关键字,若是,则执行步骤203,否则执行步骤202。步骤202、判断当前大类关键字是否为最后一条大类关键字,如果否,取下一个大 类关键字作为当前大类关键字,并返回步骤201,如果是,则判断当前POI地址名称是否为最后一条POI地址名称,如果是,则结束,否则,取 下一个POI地址名称作为当前POI地址名称,并返回步骤201。步骤203、将该大类关键字对应的子关键字群与当前POI地址名称进行匹配,若匹 配成功,则执行步骤205,否则,执行步骤204。匹配规则为,地址名称中包含子关键字群中所有的关键字,同时要求地址名称中 关键字的顺序与子关键字群中的顺序相同。步骤204、判断当前子关键字群是否为最后一条子关键字群,若是,则执行步骤 200 对下一 POI地址名称进行匹配,否则,取下一个子关键字群作为当前子关键字群,并返 回步骤203。步骤205、子关键字群匹配成功后,进行与子关键字群相应的处理方法群的规范处理。
6
步骤206、规范处理成功后将变换后的名称放入规范列表文件。步骤207、判断当前POI地址名称是否为最后一条POI地址名称,若是,则结束,否 则,取下一条POI地址名称作为当前POI地址名称,并返回步骤200。下面举一例子来说明本发明的POI地址信息处理过程。配置文件如下表所示。
ID大类关键字小类关键字处理方法1旅游区风景I旅游区风景旅游区:<dA>2名胜区风景I名胜区风景名胜区<dA>3银行银行I储蓄所I取款机储蓄所~取款机:<dA>储蓄所储蓄所->储蓄$中国工商银行中国 工商银行 工行4银行银行I分理处I取款机分理处广取款机:<dA>取款机取款机->ATM中国工商银行*->工 行设待处理的POI地址信息为中国工商银行天生分理处ATM取款机首先将POI地址信息和大类关键字匹配,大类关键字中有“银行”,所以匹配通过; 然后和银行类的第一条配置信息的子关键字群匹配,发现无法匹配到“储蓄所”,所以退出 该条配置信息,转入下一条,子关键字群中三个关键字“银行”、“分理处”和“取款机”都在 地址名称中出现,且出现前后顺序相同,子关键字群匹配成功,进入处理方法群;首先处理 “分理处+ 取款机<dA> ” 把包括“分理处”在内的“分理处”和“取款机”之间的部分删 掉,即删掉“分理处ATM”,剩余部分为“中国工商银行天生取款机”;然后处理“取款机取款 机-> ATM”,即将“取款机”改为“ATM”,修改结果为“中国工商银行天生ATM” ;至此,该条 地址匹配成功,最后进入临时方法群查找合适的处理方法,结果找到一条“中国工商银行
>工行”,将“中国工商银行”改为“工行”,最终处理结果为“工行天生ATM” ;转到下一条 地址名称进行匹配,直至结束。实施例二本实施例提供了一种兴趣点地址信息处理的装置,包括获取单元,用于获取兴趣 点地址信息;规范单元,用于根据配置文件对所述兴趣点地址信息进行处理,以获得规范的 兴趣点地址信息,所述配置文件包括兴趣点地址信息规范规则。所述兴趣点地址信息规范规则包括子关键字群,其包括兴趣点地址信息的关键 字;处理方法群,其包括规范规则,用于根据所述兴趣点地址信息的关键字获得所述规范的 兴趣点地址信息;所述规范单元具体包括匹配单元,用于将兴趣点地址信息与当前子关 键字群进行匹配,若匹配成功,则启动处理单元,否则,启动第一判断单元;处理单元,用于 利用该子关键字群所对应的处理方法群对所述兴趣点地址信息进行处理,以获得规范的兴 趣点地址信息,结束本过程;第一判断单元,用于判断当前子关键字群是否为最后一个子关 键字群,若是,则结束本过程,否则将下一个子关键字群作为当前子关键字群,启动匹配单 元,直至最后一个子关键字群为止。所述兴趣点地址信息规范规则还包括大类关键字,其为兴趣点地址信息所属类 别;在执行规范单元之前,所述装置还包括预匹配单元,用于将兴趣点地址信息与当前大 类关键字进行匹配,若匹配成功,则启动匹配单元,否则,启动第二判断单元;第二判断单 元,用于判断当前大类关键字是否为最后一个大类关键字,若是,则结束本过程,否则将下
7一个大类关键字作为当前大类关键字,启动预匹配单元,直至最后一个大类关键字为止。各个单元的详细工作原理可参见实施例一中的描述内容。根据本发明实施例,可以将同一 POI地址信息的多种表示进行规范化处理,得到 唯一的规范信息,便于今后处理;这样,当在大比例尺下,可使地图显示的内容不过于繁冗, 同时尽可能多的显示POI地址信息;因此,对政府机关、服务机构等比较严肃的地址信息, 通过该方法进行规范化,减少被投诉的可能性。虽然通过实施例描绘了本发明,但本领域普通技术人员知道,在不脱离本发明的 精神和实质的情况下,就可使本发明有许多变形和变化,本发明的范围由所附的权利要求 来限定。
权利要求
一种兴趣点地址信息处理的方法,其特征在于,包括获取兴趣点地址信息;根据配置文件对所述兴趣点地址信息进行处理,以获得规范的兴趣点地址信息,所述配置文件包括兴趣点地址信息规范规则。
2.根据权利要求1所述的方法,其特征在于,所述兴趣点地址信息规范规则包括子关键字群,其包括兴趣点地址信息的关键字;处理方法群,其包括规范规则,用于根据所述子关键字群的关键字获得所述规范的兴 趣点地址信息。
3.根据权利要求2所述的方法,其特征在于,所述规范规则包括如下处理模式的任意 一种或其任意组合两个关键字之间部分的处理模式、关键字之前部分的处理模式、关键字 之后部分的处理模式、关键字本身处理模式、括号部分处理模式和整个部分处理模式。
4.根据权利要求3所述的方法,其特征在于,所述处理模式包括处理操作,所述处理操 作包括删除操作和/或转换操作。
5.根据权利要求2至4其中之一所述的方法,其特征在于,所述根据配置文件对所述兴 趣点地址信息进行处理获得规范的兴趣点地址信息具体包括将兴趣点地址信息与当前子关键字群进行匹配,若匹配成功,则利用该子关键字群所 对应的处理方法群对所述兴趣点地址信息进行处理,以获得规范的兴趣点地址信息,结束 本过程,否则,判断当前子关键字群是否为最后一个子关键字群,若是,则结束本过程,否则 将下一个子关键字群作为当前子关键字群,重复前一步骤兴趣点地址信息与当前子关键 字群进行匹配,直至最后一个子关键字群为止。
6.根据权利要求2-4其中之一所述的方法,其特征在于,所述兴趣点地址信息规范规 则还包括大类关键字,其为兴趣点地址信息所属类别。
7.根据权利要求6所述的方法,其特征在于,在执行所述根据配置文件对所述兴趣点 地址信息进行处理获得规范的兴趣点地址信息之前,还执行下列步骤将兴趣点地址信息 与当前大类关键字进行匹配,若匹配成功,则执行所述根据配置文件对所述兴趣点地址信 息进行处理获得规范的兴趣点地址信息,否则,判断当前大类关键字是否为最后一个大类 关键字,若是,则结束本过程,否则将下一个大类关键字作为当前大类关键字,重复前一步 骤将兴趣点地址信息与当前大类关键字进行匹配,直至最后一个大类关键字为止。
8.一种兴趣点地址信息处理的装置,其特征在于,包括获取单元,用于获取兴趣点地址信息;规范单元,用于根据配置文件对所述兴趣点地址信息进行处理,以获得规范的兴趣点 地址信息,所述配置文件包括兴趣点地址信息规范规则。
9.根据权利要求8所述的装置,其特征在于,所述兴趣点地址信息规范规则包括子关 键字群,其包括兴趣点地址信息的关键字;处理方法群,其包括规范规则,用于根据所述兴 趣点地址信息的关键字获得所述规范的兴趣点地址信息;所述规范单元具体包括匹配单元,用于将兴趣点地址信息与当前子关键字群进行匹配,若匹配成功,则启动处 理单元,否则,启动第一判断单元;处理单元,用于利用该子关键字群所对应的处理方法群对所述兴趣点地址信息进行处理,以获得规范的兴趣点地址信息,结束本过程;第一判断单元,用于判断当前子关键字群是否为最后一个子关键字群,若是,则结束本 过程,否则将下一个子关键字群作为当前子关键字群,启动匹配单元,直至最后一个子关键 字群为止。
10.根据权利要求9所述的装置,其特征在于,所述兴趣点地址信息规范规则还包括 大类关键字,其为兴趣点地址信息所属类别;在执行规范单元之前,所述装置还包括预匹配单元,用于将兴趣点地址信息与当前 大类关键字进行匹配,若匹配成功,则启动匹配单元,否则,启动第二判断单元;第二判断单 元,用于判断当前大类关键字是否为最后一个大类关键字,若是,则结束本过程,否则将下 一个大类关键字作为当前大类关键字,启动预匹配单元,直至最后一个大类关键字为止。
全文摘要
本发明的实施例提供了一种兴趣点地址信息处理的方法和装置,可解决现有技术POI地址信息不规范所带来的问题。本发明的实施例提供了一种兴趣点地址信息处理的方法,包括获取兴趣点地址信息;根据配置文件对所述兴趣点地址信息进行处理,以获得规范的兴趣点地址信息,所述配置文件包括兴趣点地址信息规范规则。根据本发明实施例,可以将同一POI地址信息的多种表示进行规范化处理,得到唯一的规范信息,便于今后处理。
文档编号G06F17/30GK101957821SQ20091008943
公开日2011年1月26日 申请日期2009年7月17日 优先权日2009年7月17日
发明者王涛, 王琛 申请人:高德软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1