信息搜索方法及装置的制造方法_2

文档序号:9787428阅读:来源:国知局
置点开始一直到大洲这样一个完整的 归属地数据,即结构化的归属地数据。又例如,在百度地图中,获取某位置点所属的区县、城 市、省份,从百度百科中,获取该位置点所属的地区、国家、大洲,则可以将两个归属地片段 数据拼接在一起,形成完整的归属地数据,即结构化的归属地数据。
[0033] 可选的,从百度地图、百度百科以及百度网页等获取的位置点的归属地片段数据 可能存在关联关系或重复,因此在形成结构化的归属地数据之前,可以对各位置点的归属 地片段数据进行去重处理,以提升处理速度和准确度。
[0034] 另外,在获取各位置点结构化的归属地数据之后,可以将各位置点以及位置点的 归属地与相应的区号、邮编、经炜度信息等进行关联,将这些数据作为位置点或位置点的归 属地的属性。
[0035] 在获得各位置点结构化的归属地数据之后,可以将位置点以及结构化的归属地数 据中各归属地分别作为地理知识图谱中的节点,将节点之间的所属关系作为地理知识图谱 中的边,将各位置点关联的经炜度信息、区号、邮件等信息作为节点的属性信息,从而得到 地理知识图谱。
[0036] 例如,以故宫结构化的归属地数据为例,该结构化的归属地数据为:故宫-东城区-北京市-华北地区-中国-亚洲,其中故宫、东城区、北京市、华北地区、中国、亚洲都属于地理 实体,地理实体之间由边关系连接,故宫和东城区的边关系为区县,东城区和北京市的边关 系为城市,北京和华北地区的边关系为地区,华北地区和中国的边关系为国家,中国和亚洲 的边关系为大洲,通过用节点和边的关系表示位置点结构化的归属地数据,就构建了地理 知识图谱。同时,可以把其他一些信息如邮编、区号、经炜度信息、类型作为节点的属性信息 存储在地理知识图谱的节点上。
[0037]其中,地理知识图谱中的节点表示位置点或位置点归属的地理实体,地理知识图 谱中的边表示两个节点之间的归属关系。
[0038]基于上述,信息搜索装置根据第一搜索请求,在预先建立的地理知识图谱中进行 搜索,以获取第一位置点的归属地具体包括:
[0039] 根据第一搜索请求在地理知识图谱中搜索,以确定表示第一位置点的初始节点;
[0040] 沿着初始节点向上回溯,以获取以初始节点未起始端点的节点路径;
[0041] 获取该节点路径上除初始节点之外的其它节点表示的地理实体作为第一位置点 的归属地。
[0042] 进一步,基于地理知识图谱,用户还可以查询第一位置点对应的附属信息,第一位 置点对应的附属信息可以是第一位置点或第一位置点的归属地的属性信息,例如,具体可 以是区号、邮编、经炜度信息等。具体的,信息搜索装置还可以从沿着节点路径向上回溯,依 次查询节点路径上各节点的属性信息,直到获取第一位置点对应的附属信息为止。具体的, 若经炜度信息为附属信息,则信息搜索装置可以查询表示第一位置点的节点的属性信息, 从中获取第一位置点的经炜度信息。若区号为附属信息,则若第一位置点是比较小的POI, 如故宫,是没有区号的,则通过回溯上述节点路径,找到对应城市的区号,如故宫-东城区-北京,东城区无区号,再回溯到北京,北京有区号,这样就找到了 POK如故宫)对应的区号。
[0043] 进一步,如上述,地理知识图谱还包括:各位置点的经炜度信息。经炜度信息作为 为位置点的属性信息存储在表示相应位置点或位置点归属的地理实体的节点上。
[0044] 基于上述,通过地理知识图谱还可以搜索指定范围内的位置点。具体的,当用户希 望搜索在第一位置点指定范围内的指定类型的第二位置点时,可以在搜索引擎提供的搜索 框内输入搜索词,并点击搜索按钮发出搜索请求,这里的搜索请求即为第二搜索请求。信息 搜索装置接收第二搜索请求,第二搜索请求用于请求在第一位置点指定范围内搜索指定类 型的第二位置点;根据第二搜索请求,在地理知识图谱中搜索,以获取第一位置点的经炜度 信息;根据第一位置点的经炜度信息和指定范围,确定位于第一位置点指定范围内的位置 点作为候选位置点;获取候选位置点中类型属于指定类型的位置点作为第二位置点。
[0045] 进一步,在确定第二位置点之后,还可以从地理知识图谱中,获取第二位置点的经 炜度信息。然后根据下述公式,计算第一位置点和第二位置点之间的实际距离。
[0047] 在上述公式中,a = Latl_Lat2,表示第一位置点和第二位置点的炜度之差;b = Lngl-Lng2,表示第一位置点和第二位置点的经度之差;Latl表示第一位置点的经度,Lngl 表示第二位置点的维度;Lat2表示第二位置点的经度;Lng2表示第二位置点的维度;R表示 地球半径。
[0048] 由上述可见,本实施例通过文本挖掘、命名实体识别获取各位置点的归属地片段 数据,通过进行拼接和/或填充以形成结构化的归属地数据,进而构建地理知识图谱;之后, 基于地理知识图谱获取位置点的归属地、附属信息以及在第一位置点指定范围内的指定类 型的其它位置点,有利于满足用户多种地理相关的搜索需求,解决了对内容网站或问答平 台的依赖,并且有利于降低了用户获取信息的成本。
[0049] 需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列 的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为 依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知 悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明 所必须的。
[0050] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部 分,可以参见其他实施例的相关描述。
[0051] 图2为本发明另一实施例提供的信息搜索装置的结构示意图。如图2所示,该装置 包括:接收模块21、搜索模块22和输出模块23。
[0052]接收模块21,用于接收第一搜索请求,第一搜索请求用于请求查询第一位置点的 归属地。
[0053]搜索模块22,用于根据接收模块21接收的第一搜索请求在预先建立的地理知识图 谱中进行搜索,以获取第一位置点的归属地,地理知识图谱包括各位置点的归属关系。
[0054] 输出模块23,用于输出搜索模块22获取的第一位置点的归属地。
[0055] 在一可选实施方式中,上述地理知识图谱中的节点表示位置点或位置点归属的地 理实体,边表示两个节点之间的归属关系。
[0056] 基于上述,搜索模块22具体可用于:
[0057] 根据第一搜索请求在地理知识图谱中搜索,以确定表示第一位置点的初始节点;
[0058] 沿着初始节点向上回溯,以获取以初始节点为起始端点的节点路径;
[0059] 获取节点路径上除初始节点之外的其它节点表示的地理实体作为第一位置点的 归属地。
[0060] 在一可选实施方式中,搜索模块22还用于:
[0061] 沿着节点路径向上回溯,依次查询节点路径上各节点的属性信息,直到获取第一 位置点对应的附属信息为止。第一位置点对应的附属信息可以是第一位置点或第一位置点 的归属地的属性信息,例如,具体可以是区号、邮编、经炜度信息等。
[0062]进一步,上述地理知识图谱还包括:各位置点的经炜度信息。
[0063]基于上述,搜索模块22还用于:
[0064]接收第二搜索请求,第二搜索请求用于请求在第一位置点指定范围内搜索指定类 型的第二位置点;
[0065]根据第二搜索请求在地理知识图谱中搜索,以获取第一位置点的经炜度信息;
[0066] 根据第一位置点的经炜度信息和指定范围,确定位于第一位置点指定范围内的位 置点作为候选位置点;
[0067] 获取候选位置点中类型属于指定类型的位置点以作为第二位置点。
[0068]在一可选实施方式中,如图3所示,该装置还包括:构建模块24,用于预先建立地理 知识图谱。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1