对poi信息进行分类的方法、装置和系统的制作方法

文档序号:9200467阅读:246来源:国知局
对poi信息进行分类的方法、装置和系统的制作方法
【技术领域】
[0001]本发明涉及计算机技术领域,具体而言,本发明涉及对POI信息进行分类的方法和装置。
【背景技术】
[0002]随着科技的发展和社会的进步,包括电子地图在内的地理信息服务以其方便快捷、直观可视化的特点,日益受到网民的欢迎,并广泛应用于各个生活领域,同时,各行各业对与位置相关的信息的获取需求愈来愈强烈,其中,与位置相关的信息可能包括某地址处的宾馆、机场、餐馆、银行、商场、医院、公园、加油站等,此类与位置相关的地理实体信息称为POI信息。由于此类POI信息将地理实体信息与地理位置信息相整合,因此能够给用户带来极大的便捷。为了进一步提高用户查询POI信息的效率,从而更好地帮助人们提高生活效率及生活质量,需要对POI位置信息进行分类。
[0003]现有技术中一般通过提取POI信息对应的网页中的文本内容,并基于文本内容与预定关键字进行匹配来确定POI信息的分类,即现有的POI信息分类方式中需要对POI信息对应的网页的全文文本做切词,随后将切分后的大量切分片段逐一与预定关键字进行匹配,如果匹配命中则该POI信息属于预定关键字对应的分类。
[0004]现有的POI信息分类方式的缺点主要包括:一方面,由于网页文本内容通常比较长,因此对网页文本进行切词的耗时较长,且切词后的得到的切分片段较多,使得关键字匹配次数也相应较多,因此总体分类运行效率较低;另一方面,POI信息对应的网页中的网页文本并非所有内容都能够代表POI信息的种类,即并非所有文本内容都与POI信息相关,因此传统分类方法中由于大量干扰信息的存在,使得分类准确率偏低。

【发明内容】

[0005]为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
[0006]本发明的实施例提出了一种对POI信息进行分类的方法,包括:
[0007]提取待分类POI信息的名称信息;
[0008]对名称信息进行切词处理,获取多个切分片段;
[0009]将多个切分片段以预定匹配顺序与分类关键词进行匹配;
[0010]将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类。
[0011]本发明的实施例还提出了一种对POI信息进行分类的装置,其特征在于,包括:
[0012]名称提取模块,用于提取待分类POI信息的名称信息;
[0013]切词模块,用于对名称信息进行切词处理,获取多个切分片段;
[0014]匹配模块,用于将多个切分片段以预定匹配顺序与分类关键词进行匹配;
[0015]分类确定模块,用于将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类
[0016]本方案的实施例中,由于仅需对待分类POI信息的名称信息进行切词处理,可降低切词所需时间;随后将切词得到的切分片段进行关键词匹配,基于切词后的得到的较少切分片段,在后续进行关键字匹配时匹配次数也可相应减少,提高了 POI信息分类过程的运行时间;同时,由于名称信息与POI信息具有高相关性,使得基于名称信息确定的分类准确性较高,从整体上提高了 POI信息分类的效率。
[0017]本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0018]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0019]图1为本发明中对POI信息进行分类的方法一个实施例的流程图;
[0020]图2为本发明中对POI信息进行分类的装置一个实施例的结构示意图。
【具体实施方式】
[0021]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0022]本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
[0023]本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0024]图1为本发明中对POI信息进行分类的方法一个实施例的流程图。
[0025]步骤SllO:提取待分类POI信息的名称信息;步骤S120:对名称信息进行切词处理,获取多个切分片段;步骤S130:将多个切分片段以预定匹配顺序与分类关键词进行匹配;步骤S140:将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类。
[0026]本方案的实施例中,由于仅需对待分类POI信息的名称信息进行切词处理,可降低切词所需时间;随后将切词得到的切分片段进行关键词匹配,基于切词后的得到的较少切分片段,在后续进行关键字匹配时匹配次数也可相应减少,提高了 POI信息分类过程的运行时间;同时,由于名称信息与POI信息具有高相关性,使得基于名称信息确定的分类准确性较高,从整体上提高了 POI信息分类的效率。
[0027]步骤SllO:提取待分类POI信息的名称信息。
[0028]其中,POI信息中包括但不限于名称信息、地址信息、经玮度、联系方式等。
[0029]例如,一条待分类POI信息为“陕西西安灞桥席王新寺路569号第四军医大学唐都医院”,基于预先标记的名称标识或基于字符串匹配等方式,从该条待分类POI信息中提取名称信息为“第四军医大学唐都医院”。
[0030]步骤S120:对名称信息进行切词处理,获取多个切分片段。
[0031]具体地,以逆向切分方式对名称信息进行切词处理,获取多个切分片段;其中,逆向切分方式包括最大逆向匹配法、最小逆向匹配法等。
[0032]例如,接上例,对名称信息“第四军医大学唐都医院”进行切词处理,切词后获取多个切分片段包括第四”、“军医”、“大学”、“唐都”和“医院”。
[0033]步骤S130:将多个切分片段以预定匹配顺序与分类关键词进行匹配。
[0034]具体地,将多个切分片段以其在名称信息中的逆向出现顺序依次与分类关键词进行匹配。
[0035]例如,多个切分片段分别为“第四”、“军医”、“大学”、“唐都”和“医院”,该五个且切分片段在名称信息“第四军医大学唐都医院”中的逆向出现顺序依次为“医院”为逆向第一排序、“唐都”为逆向第二排序、“大学”为逆向第三排序、“军医”为逆向第四排序、“第四”为逆向第五排序;将该五个且切分片段按照逆向出现顺序依次与分类关键词进行匹配,即首先使用切分片段“医院”与分类关键词进行匹配。
[0036]步骤S140:将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类。
[0037]例如,接上例,若使用切分片段“医院”与分类关键词“医院”匹配成功时,确定待分类POI信息的所属分类为“医院”;若使用“医院”匹配不成功,则继续按照逆向出现顺序依次进行匹配,即使用“唐都”进行匹配,直至将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类。
[0038]优选地,POI信息的所属分类包括至少一个等级;当包括多个等级时,上级分类包括多个下级分类。
[0039]更优选地(参照图1),步骤S140包括步骤S141 (图中未示出)和步骤S142 (图中未示出);步骤S141:当最先匹配成功的切分片段对应的分类关键词所在的POI分类为下级分类时,提取该下级分类对应的上级分类;步骤S142:将上级分类及下级分类确定为待分类POI信息的所属分类。
[0040]例如,POI信息所属分类包括两个等级,上级分类为“医疗”,其包括的下级分类包括“医院”、“诊所”、“药店”、“急救中心”等。接前例,最先匹配成功的切分片段对应的分类关键词“医院”所在的POI分类为下级分类,提取该下级分类“医院”对应的上级分类“医疗”;将上级分类及下级分类确定为待分类POI信息的所属分类,即该待分类POI信息的所属分类为“医疗-医院”。
[0041]图2为本发明中对POI信息进行分类的装置一个实施例的结构示意图。
[0042]名称提取模块210提取待分类POI信息的名称信息;切词模块220对名称信息进行切词处理,获取多个切分片段;匹配模块230将多个切分片段以预定匹配顺序与分类关键词进行匹配;分类确定模块240将最先匹配成功的切分片段对应的分类关键词指向的POI分类,确定为待分类POI信息的所属分类。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1