一种兴趣点poi数据的分类方法和装置的制造方法

文档序号:9432729阅读:537来源:国知局
一种兴趣点poi数据的分类方法和装置的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域,特别涉及一种兴趣点POI数据的分类方法和装置。
【背景技术】
[0002]POI (Point of Interest),即兴趣点,是地理信息系统中重要的信息,甚至可以称为整个地图导航产业的基石。在地理信息系统中,一个POI可以是一栋房子,一个商铺,一个邮筒,一个公交站等。传统的地理信息采集方法需要地图测绘人员采用精密的测绘仪器去获取一个POI的经玮度,然后再标记下来。
[0003]而在互联网中,实现了将测绘得到的底图数据制成电子地图,自然地,在电子地图中可以根据POI经玮度将其在电子地图中加以标注。现有的生活服务类平台大多拥有自己的POI数据库,可以为用户提供服务型POI数据,但POI数据库只能涵盖部分POI信息,在海量网页中依然存在着许多未被收录的POI数据,由此产生了对POI进行数据挖掘的需求。
[0004]但挖掘到的POI数据往往只包含名称、地址、经玮度、分类信息中的一种或几种,而用户在利用电子地图的搜索功能搜索POI时,往往需要按类别搜索POI数据,如搜索附近的餐馆时,如果POI数据不包含分类信息,那么在名称中不包含“餐馆”的POI数据通常无法呈现给用户,例如属于“餐馆”的“俏江南”,因为名称原因就不会被提供给用户。因此产生了对POI数据进行分类,或对已有的POI数据的分类信息加以修改的需求。

【发明内容】

[0005]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的兴趣点POI数据的分类方法和装置。
[0006]依据本发明的一个方面,提供了一种兴趣点POI数据的分类方法,包括:对于获取到的一个POI数据,根据该POI数据的内容确定对应的品牌信息;根据所确定的品牌信息查询各品牌信息对应分类信息的数据库,查找到与其对应的分类信息;根据所查找到的分类信息确定所述POI数据的分类,或者根据所查找到的分类信息纠正所述POI数据的分类。
[0007]可选地,该方法进一步包括:获取品牌信息以及品牌对应的分类信息,保存到所述数据库中。
[0008]可选地,获取品牌信息以及品牌对应的分类信息,保存到所述数据库中包括:从互联网中挖掘一批包含分类信息的POI数据;对于所述一批POI数据中的每个POI数据,从该POI数据中分析得到其品牌信息;将所述一批POI数据,按照品牌信息进行分类;对于每个类,根据该类中的各POI数据所包含的分类信息最终确定该类的分类信息;将每个类对应的品牌信息和分类信息对应保存到所述数据库中。
[0009]可选地,所述从该POI数据中分析得到其品牌信息包括:如果该POI数据以括号分隔为两部分,则括号外的部分为品牌信息,括号内的部分为非品牌信息;如果该POI数据以连接号分隔为两部分,则连接号前的部分为品牌信息,将连接号后的部分为非品牌信息。
[0010]可选地,所述对于每个类,根据该类中的各POI数据所包含的分类信息最终确定该类的分类信息包括:如果该类中的各POI数据所包含的分类信息为同一个分类信息,则将该同一个分类信息作为该类的分类信息;如果该类中的各POI数据所包含的分类信息为不同的多个分类信息,则从所述多个分类信息中选择一个分类信息作为该类的分类信息,或者,将所述多个分类信息共同作为该类的分类信息,或者,根据所述多个分类信息概括出一个分类信息作为该类的分类信息。
[0011]可选地,从所述多个分类信息中选择一个分类信息作为该类的分类信息包括:选择对应的POI数据最多的一个分类信息作为该类的分类信息。
[0012]可选地,所述根据该POI数据的内容确定对应的品牌信息包括:如果该POI数据以括号分隔为两部分,则括号外的部分为品牌信息,括号内的部分为非品牌信息;如果该POI数据连接号分隔为两部分,则连接号前的部分为品牌信息,将连接号后的部分为非品牌信息。
[0013]可选地,该方法进一步包括:对于获取到的一个POI数据,如果根据该POI数据的内容无法确定对应的品牌信息,则直接将该POI数据与所述数据库中的各品牌信息进行匹配,如果通过匹配得知该POI数据中包含所述数据库中的一个品牌信息,则确定该品牌信息即为该POI数据对应的品牌信息。
[0014]依据本发明的另一方面,一种兴趣点POI数据的分类装置,其中,该装置包括:品牌信息确定单元,适于对于获取到的一个POI数据,根据该POI数据的内容确定对应的品牌信息;查找单元,适于根据所确定的品牌信息查询各品牌信息对应分类信息的数据库,查找到与其对应的分类信息;品牌分类单元,适于根据将所查找到的分类信息确定所述POI数据的分类,或者根据所查找到的分类信息纠正所述POI数据的分类。
[0015]可选地,该装置进一步包括:品牌分类获取单元,适于获取品牌信息以及品牌对应的分类信息,保存到所述数据库中。
[0016]可选地,所述品牌分类获取单元,适于从互联网中挖掘一批包含分类信息的POI数据;对于所述一批POI数据中的每个POI数据,从该POI数据中分析得到其品牌信息;将所述一批POI数据,按照品牌信息进行分类;对于每个类,根据该类中的各POI数据所包含的分类信息最终确定该类的分类信息;将每个类对应的品牌信息和分类信息对应保存到所述数据库中。
[0017]可选地,所述品牌分类获取单元,适于当该POI数据以括号分隔为两部分时,将括号外的部分确定为品牌信息,将括号内的部分确定为非品牌信息;以及当该POI数据以连接号分隔为两部分时,将连接号前的部分确定为品牌信息,将连接号后的部分确定为非品牌信息。
[0018]可选地,所述品牌分类获取单元,适于当该类中的各POI数据所包含的分类信息为同一个分类信息时,将该同一个分类信息作为该类的分类信息;当该类中的各POI数据所包含的分类信息为不同的多个分类信息时,从所述多个分类信息中选择一个分类信息作为该类的分类信息,或者,将所述多个分类信息共同作为该类的分类信息,或者,根据所述多个分类信息概括出一个分类信息作为该类的分类信息。
[0019]可选地,所述品牌分类获取单元,适于当该类中的各POI数据所包含的分类信息为不同的多个分类信息时,选择对应的POI数据最多的一个分类信息作为该类的分类信息。
[0020]可选地,所述品牌信息确定单元,适于当该POI数据以括号分隔为两部分时,将括号外的部分确定为品牌信息,括号内的部分确定为非品牌信息;以及适于当该POI数据连接号分隔为两部分时,将连接号前的部分确定为品牌信息,将连接号后的部分确定为非品牌信息。
[0021]可选地,所述查找单元,进一步适于对于获取到的一个POI数据,当所述品牌信息确定单元根据该POI数据的内容无法确定对应的品牌信息时,直接将该POI数据与所述数据库中的各品牌信息进行匹配,如果通过匹配得知该POI数据中包含所述数据库中的一个品牌信息,则确定该品牌信息即为该POI数据对应的品牌信息。
[0022]由上述可知,本发明的技术方案,对于获取到的一个POI数据,先根据该POI数据的内容确定对应的品牌信息,再根据所确定的品牌信息查询各品牌信息对应分类信息的数据库,查找到与其对应的分类信息,最终根据所查找到的分类信息确定所述POI数据的分类,或者根据所查找到的分类信息纠正所述POI数据的分类。该技术方案既可以对原本不包含分类信息的POI数据进行补全,还可以检验已包含分类信息的POI数据中的分类信息是否正确,如不正确还可纠正,在用户按分类信息搜
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1