一种地址查询串解析方法及装置的制造方法

文档序号:9304553阅读:238来源:国知局
一种地址查询串解析方法及装置的制造方法
【技术领域】
[0001]本发明涉及地理位置搜索技术领域,尤其涉及一种地址查询串解析方法及装置。
【背景技术】
[0002]现有地址搜索已经是人们使用地图产品的重要业务。通过地址搜索,人们可以实现对特定目的地、生活类服务、路途规划的应用需求。
[0003]然而地址搜索具备自身的特殊性。在地图搜索引擎中,POI (Point of Interest,兴趣点)等数据在建立倒排索引时,是以空间来区分的。找到正确的空间范围来检索用户的需求至关重要。
[0004]通常,在地图搜索时,用户不会自己指定出空间范围。对空间范围的解析往往需要通过计算机分析用户的查询串来得到。在解析出空间范围之后,还需要从用户的查询串中提取出用户真正想要搜索的POI (或者地址),再能在正确的空间范围检索出用户真实的搜索需求。简而言之,就是需要计算机分析出用户“想在什么地方”搜素“什么东西”,又称之为“where what ”解析问题。
[0005]例如,用户查询“北京市朝阳区阜通东大街方恒国际中心”,用户是期望在“北京市朝阳区阜通东大街”的范围内搜索“方恒国际中心”,而现有的地址搜索并不能准确的解析出用户查询意图,通常会在“北京市”的范围内搜索“朝阳区阜通东大街方恒国际中心”,不能准确的得到搜索结果,用户体验不好。亟需要一种可以准确分析出查询串中的where信息和what信息,从而在正确的空间范围查询找正确的内容串,以提升搜索质量。

【发明内容】

[0006]本发明实施例提供一种地址查询串解析方法及装置,用以解决现有技术中在地址搜索结果不准确的问题。
[0007]本发明实施例提供一种地址查询串解析方法,该方法包括:
[0008]获取用户输入的地址查询串并通过地理信息系统GEO解析,得到地址串;
[0009]将所述地址串中地址成分和非地址成分通过模式识别进行修正,得到修正地址查询串;
[0010]根据所述修正地址查询串分别构造一级子串和二级子串,作为解析结果。
[0011]所述方法还包括:
[0012]根据预先设定的过滤词表,过滤所述一级子串和二级子串中非地址成分,将过滤后的所述一级子串和二级子串作为解析结果。
[0013]所述过滤所述一级子串和二级子串中非地址成分,包括:
[0014]确定所述非地址成分是否命中所述过滤词表,若是,直接过滤;否则,继续如下步骤;
[0015]确定所述非地址成分是否为类别词,若是,直接过滤;否则,继续如下步骤;
[0016]确定所述非地址成分是否为门址类词,若是,直接过滤;否则,不过滤。
[0017]所述分别构造一级子串和二级子串,包括:
[0018]获取所述修正地址查询串中区县级别的空间信息和最小地址片段的空间信息;
[0019]在所述区县级别的空间信息范围搜索区县级别以下的查询串片段,作为一级子串;
[0020]在所述最小地址片段的空间信息范围搜索最小地址片段之后的查询串片段,作为二级子串。
[0021]所述将所述地址串中地址成分和非地址成分通过模式识别进行修正,包括:
[0022]获取所述地址成分前的非地址成分mstart和地址成分后的非地址成分mend ;
[0023]通过模式识别,判断所述mstart和mend是否为重要;
[0024]若所述mstart为重要及所述mend为不重要,则将所述mend加入所述地址成分中的街道片段之后;将所述mstart内容写入所述mend ;将所述mstart内容置空;
[0025]若所述mstart和mend均为重要,则将所述mstart内容置空;
[0026]若所述mstart为不重要及所述mend为重要,则将所述mstart内容置空。
[0027]所述方法还包括:
[0028]若所述mstart内容为空,则不进行模式识别。
[0029]所述通过模式识别,判断所述mstart和mend是否为重要,包括:
[0030]确定所述非地址成分是否为连锁店名称词或品牌词,若是,判定为重要,否则,继续如下步骤;
[0031]确定所述非地址成分是否为类别词,若是,判定为不重要,否则,继续如下步骤;
[0032]对所述非地址成分分词,确定所述非地址成分为区域性地址词加类别词,若是,判定为重要,否则,判定为不重要。
[0033]一种地址查询串解析装置,该装置包括:
[0034]GEO解析模块,用于获取用户输入的地址查询串并通过地理信息系统GEO解析,得到地址串;
[0035]模式识别模块,用于将所述地址串中地址成分和非地址成分通过模式识别进行修正,得到修正地址查询串;
[0036]子串构造模块,根据所述修正地址查询串分别构造一级子串和二级子串,作为解析结果。
[0037]所述装置还包括过滤词表模块,用于根据预先设定的过滤词表,过滤所述一级子串和二级子串中非地址成分,将过滤后的所述一级子串和二级子串作为解析结果。
[0038]所述过滤词表模块,包括:
[0039]过滤词表判定子模块,用于确定所述非地址成分是否命中所述过滤词表;
[0040]类别词判定子模块,确定所述非地址成分是否为类别词;
[0041]门址类词判定子模块,确定所述非地址成分是否为门址类词。
[0042]所述子串构造模块,包括:
[0043]空间信息获取子模块,用于获取所述修正地址查询串中区县级别的空间信息和最小地址片段的空间信息;
[0044]—级子串构造子模块,用于在所述区县级别的空间信息范围搜索区县级别以下的查询串片段,作为一级子串;
[0045]二级子串构造子模块,用于在所述最小地址片段的空间信息范围搜索最小地址片段之后的查询串片段,作为二级子串。
[0046]所述模式识别模块,包括:
[0047]地址划分子模块,用于获取所述地址成分前的非地址成分mstart和地址成分后的非地址成分mend ;
[0048]模式识别子模块,用于通过模式识别判断所述mstart和mend是否为重要;若所述mstart为重要及所述mend为不重要,则将所述mend加入所述地址成分中的街道片段之后;将所述mstart内容写入所述mend ;将所述mstart内容置空;若所述mstart和mend均为重要,则将所述mstart内容置空;若所述mstart为不重要及所述mend为重要,则将所述mstart内容置空。
[0049]所述模式识别子模块,还用于确定所述非地址成分是否为连锁店名称词或品牌词,若是,判定为重要;确定所述非地址成分是否为类别词,若是,判定为不重要;对所述非地址成分分词,确定所述非地址成分为区域性地址词加类别词,若是,判定为重要,否则,判定为不重要。
[0050]本发明实施例通过获取用户输入的地址查询串并通过地理信息系统GEO解析,得到地址串;将所述地址串中地址成分和非地址成分通过模式识别进行修正,得到修正地址查询串;根据所述修正地址查询串分别构造一级子串和二级子串,作为解析结果。通过解析结果、在两层空间内做出where what解析,可以更加有益于扩大地址搜索引擎的召回率,得到用户更加期望的结果;在此基础上,本发明实施例做了两层what的过滤,可以在保证扩大召回率的基础上,减少无关结果的召回,保证召回的准确度。
【附图说明】
[0051]图1为本发明实施例1提供的地址查询串解析方法流程图;
[0052]图2为本发明实施例2提供的地址查询串解析方法流程图;
[0053]图3为本发明实施例5提供的查询地址串解析装置结构示意图;
[0054]图4为本发明实施例6提供的过滤词表模块34结构示意图;
[0055]图5为本发明实施例7提供的子串构造模块33结构示意图;
[0056]图6为本发明实施例8提供的模式识别模块32结构示意图。
【具体实施方式】
[0057]本发明实施例通过获取用户输
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1