选择兴趣点poi数据的方法及装置的制造方法_4

文档序号:9396891阅读:来源:国知局
相同名称信息的多个POI数据分别对应的用户关注度进行排序。
[0120]优选地,排序模块340提取多个POI数据中用户关注度大于关注度阈值的至少两个POI数据;基于用户关注度对至少两个POI数据进行排序。
[0121]具体地,从多个POI数据中提取用户关注度大于关注度阈值的至少两个POI数据;将该至少两个POI数据分别对应的用户关注度进行排序。
[0122]选择模块350基于POI数据的排序选择一个或多个POI数据,作为对应该相同的名称信息的可信POI数据。
[0123]具体地,从排序后的POI数据中选择排名前一个或多个POI数据,作为对应该相同的名称信息的可信POI数据。
[0124]本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、⑶-ROM、和磁光盘)、ROM (Read-Only Memory,只读存储器)、RAM (Random Access Memory,随即存储器)、EPROM (Erasable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(ElectricalIy ErasableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
[0125]本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
[0126]本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
[0127]以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种选择兴趣点POI数据的方法,其特征在于,包括: 获取包括具有相同的名称信息的不同POI数据的多个网页页面; 提取所述多个网页页面的用户关注度信息; 根据各网页页面的用户关注度信息,确定各网页页面中包括的一个或多个POI数据所对应的用户关注度; 基于用户关注度对所述多个网页页面中包括的具有相同名称信息的多个POI数据进tx排序; 基于所述POI数据的排序选择一个或多个所述POI数据,作为对应该相同的名称信息的可信POI数据。2.根据权利要求1所述的选择兴趣点POI数据的方法,其中,提取所述多个网页页面的用户关注度信息的步骤,进一步包括: 根据各网页页面在第一时长内的用户访问次数和/或平均每次浏览时长,获取各网页页面的用户关注度信息。3.根据权利要求1或2所述的选择兴趣点POI数据的方法,其中,当网页页面中仅包括一个POI数据时,根据各网页页面的用户关注度信息,确定各网页页面中包括的一个或多个POI数据所对应的用户关注度的步骤,进一步包括: 将网页页面的用户关注度信息作为该网页页面中包括的一个POI数据的用户关注度。4.根据权利要求1或2所述的选择兴趣点POI数据的方法,其中,当网页页面中包括多个POI数据时,根据各网页页面的用户关注度信息,确定各网页页面中包括的一个或多个POI数据所对应的用户关注度的步骤,进一步包括: 按照预定频率抓取第二时长内各网页页面中的页面内容; 提取每次抓取到的页面内容中的POI数据; 判断所述第二时长内各网页页面的页面内容中POI数据是否发生变更; 基于判断结果选择相应的关注度分配规则; 基于所述相应的关注度分配规则,根据各网页页面的用户关注度,并结合各网页页面中包括的POI数据的个数,确定各网页页面中包括的多个POI数据的用户关注度。5.根据权利要求4所述的选择兴趣点POI数据的方法,其中,基于判断结果选择相应的关注度分配规则,包括以下情形: 当POI数据未发生变更时,选择将网页页面的用户关注度信息作为该网页页面中包括的各POI数据的用户关注度的关注度分配规则;或 当POI数据发生变更时,选择将网页页面的用户关注度信息平均分配至该网页页面中包括的各POI数据的用户关注度的关注度分配规则。6.根据权利要求1-5中任一项所述的选择兴趣点POI数据的方法,其中,基于用户关注度对所述多个网页页面中包括的具有相同名称信息的多个POI数据进行排序的步骤,进一步包括: 提取多个POI数据中用户关注度大于关注度阈值的至少两个POI数据; 基于用户关注度对所述至少两个POI数据进行排序。7.一种选择兴趣点POI数据的装置,其特征在于,包括: 获取模块,用于获取包括具有相同的名称信息的不同POI数据的多个网页页面; 提取模块,用于提取所述多个网页页面的用户关注度信息; 确定模块,用于根据各网页页面的用户关注度信息,确定各网页页面中包括的一个或多个POI数据所对应的用户关注度; 排序模块,用于基于用户关注度对所述多个网页页面中包括的具有相同名称信息的多个POI数据进行排序; 选择模块,用于基于所述POI数据的排序选择一个或多个所述POI数据,作为对应该相同的名称信息的可信POI数据。8.根据权利要求7所述的选择兴趣点POI数据的装置,其中,所述提取模块具体用于根据各网页页面在第一时长内的用户访问次数和/或平均每次浏览时长,获取各网页页面的用户关注度信息。9.根据权利要求7或8所述的选择兴趣点POI数据的装置,其中,当网页页面中仅包括一个POI数据时,所述确定模块具体用于将网页页面的用户关注度信息作为该网页页面中包括的一个POI数据的用户关注度。10.根据权利要求7或8所述的选择兴趣点POI数据的装置,其中,当网页页面中包括多个POI数据时,所述确定模块具体包括: 抓取单元,用于按照预定频率抓取第二时长内各网页页面中的页面内容; 提取单元,用于提取每次抓取到的页面内容中的POI数据; 判断单元,用于判断所述第二时长内各网页页面的页面内容中POI数据是否发生变更; 选择单元,用于基于判断结果选择相应的关注度分配规则; 确定单元,用于基于所述相应的关注度分配规则,根据各网页页面的用户关注度,并结合各网页页面中包括的POI数据的个数,确定各网页页面中包括的多个POI数据的用户关注度。11.根据权利要求10所述的选择兴趣点POI数据的装置,其中,基于判断结果选择相应的关注度分配规则,包括以下情形: 当POI数据未发生变更时,选择将网页页面的用户关注度信息作为该网页页面中包括的各POI数据的用户关注度的关注度分配规则;或 当POI数据发生变更时,选择将网页页面的用户关注度信息平均分配至该网页页面中包括的各POI数据的用户关注度的关注度分配规则。12.根据权利要求7-11中任一项所述的选择兴趣点POI数据的装置,其中,所述排序装置具体用于提取多个POI数据中用户关注度大于关注度阈值的至少两个POI数据;基于用户关注度对所述至少两个POI数据进行排序。
【专利摘要】本发明提供了一种选择兴趣点POI数据的方法,包括:获取包括具有相同的名称信息的不同POI数据的多个网页页面;提取多个网页页面的用户关注度信息;根据各网页页面的用户关注度信息,确定各网页页面中包括的一个或多个POI数据所对应的用户关注度;基于用户关注度对多个网页页面中包括的具有相同名称信息的多个POI数据进行排序;基于POI数据的排序选择一个或多个POI数据,作为对应该相同的名称信息的可信POI数据。根据用户关注度可从具有相同的名称信息的不同POI数据中选择出可信度较高的POI数据,解决了现有技术难以甄别出哪个POI数据中的名称信息对应的地址信息是准确的问题,提高了对收集POI数据的准确率。
【IPC分类】G06F17/30
【公开号】CN105117425
【申请号】CN201510463031
【发明人】王智广, 魏少俊
【申请人】北京奇虎科技有限公司, 奇智软件(北京)有限公司
【公开日】2015年12月2日
【申请日】2015年7月31日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1