一种地址搜索方法和设备的制造方法

文档序号:9765970阅读:275来源:国知局
一种地址搜索方法和设备的制造方法
【技术领域】
[0001]本发明涉及数据处理技术领域,尤其涉及一种地址搜索方法和设备。
【背景技术】
[0002]随着通信技术和终端技术的发展,越来越多的应用依赖移动终端。尤其是导航类应用。例如:用户可以通过语音方式或者文字输入方式向移动终端发起导航请求,由导航类应用根据接收到的导航请求选择导航路线,并将选择的导航路线推送给用户。
[0003]具体地,导航类应用根据接收到的导航请求选择导航路线的方式包括但不限于:
[0004]当所述导航请求以文字形式输入时,采用CRF(英文:Condit1n RandomField ;中文:条件随机场)算法,从接收到的导航请求中提取地址名称、建筑名称/单位名称,利用提取出的地址名称、建筑名称/单位名称确定导航请求的目标地址。
[0005]当所述导航请求以语音形式输入时,以该语音中包含的地址信息作为搜索依据,确定导航请求的目标地址。
[0006]存在的缺陷是:在确定目标地址时,单一利用从文字或者语音中提取出的地址名称(或者建筑名称/单位名称)和地址数据库中的地址信息进行匹配,使得确定出的目标地址集合中包含大量不相关的地址,降低了地址的搜索精度。

【发明内容】

[0007]有鉴于此,本发明实施例提供了一种地址搜索方法和设备,用于解决目前存在的在地址搜索过程中,搜索到大量不相关的地址,导致地址的搜索精度较低的问题。
[0008]根据本发明的第一方面,提供了一种地址搜索方法,包括:
[0009]获取地址搜索请求信息,并确定所述地址搜索请求信息中包含的待搜索的目标地址信息;
[0010]将所述目标地址信息拆分为至少一个子地址信息,所述目标地址信息为由多个不同的子地址信息组成的,所述多个不同的子地址信息分别对应不同的地址类型;
[0011]将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,其中,所述地址数据库中存储的每一条地址信息包含构成该地址信息的不同子地址信息;
[0012]将匹配得到的匹配度大于设定阈值的地址信息,作为搜索到的目标地址信息进行输出。
[0013]结合本发明第一方面可能的实施方式,在第一种可能的方式中,获取地址搜索请求信息,包括:
[0014]接收输入的语音数据,其中,所述语音数据用以发起地址搜索;
[0015]对所述语音数据进行识别,得到所述语音数据中包含的待搜索的目标地址信息。
[0016]结合本发明第一方面可能的实施方式,或者结合本发明第一方面第一种可能的实施方式,在第二种可能的方式中,通过以下方式得到待搜索的目标地址信息:
[0017]确定所述地址搜索请求信息中包含的至少一个关键词;
[0018]针对确定的每一个关键词,执行:在预先设置的对应不同地址类型的文本地址词典中,找到包含该关键词的文本地址词典;利用用于表征找到的文本地址词典对应的地址类型的字符串,替换该关键词;
[0019]利用用以表示地址信息的正则表达式,判断每一个关键词被替换为对应的字符串后构成的字符串组是否表示地址信息;
[0020]在确定所述字符串组表示地址信息时,根据所述字符串组确定待搜索的目标地址信息对应的准地址字符串;
[0021 ] 将所述准地址字符串作为一个条件随机场CRF特征,基于CRF算法在所述地址搜索请求息中提取待搜索的目标地址信息。
[0022]结合本发明第一方面第二种可能的实施方式,在第三种可能的实施方式中,根据所述字符串组确定待搜索的目标地址信息对应的准地址字符串,包括:
[0023]确定所述字符串组包含的字符串为多个、且在多个字符串分别替换的关键词在所述地址搜索请求信息中位置连续;
[0024]若多个字符串不存在重复时,将所述多个字符串基于替换的关键词的位置连续性合并为一个字符串组,作为待搜索的目标地址信息对应的准地址字符串;
[0025]若多个字符串存在重复时,去除重复的字符串,并将去除重复的字符串后的至少一个字符串基于替换的关键词的位置连续性合并为一个字符串组,作为待搜索的目标地址信息对应的准地址字符串。
[0026]结合本发明第一方面可能的实施方式,或者结合本发明第一方面第一种可能的实施方式,或者结合本发明第一方面第二种可能的实施方式,或者结合本发明第一方面第三种可能的实施方式,在第四种可能的方式中,将所述目标地址信息拆分为至少一个子地址信息,包括:
[0027]根据预先设置的对应不同地址类型的文本地址词典所表示的地址类型,从所述目标地址信息中拆分出对应不同地址类型的子地址信息。
[0028]结合本发明第一方面可能的实施方式,或者结合本发明第一方面第一种可能的实施方式,或者结合本发明第一方面第二种可能的实施方式,或者结合本发明第一方面第三种可能的实施方式,或者结合本发明第一方面第四种可能的实施方式,在第五种可能的方式中,所述地址类型包括下述中的一种或多种信息组合:
[0029]行政区域信息、道路名称信息、建筑/单位名称信息、所述道路名称的附属内容、所述建筑/单位名称的附属内容。
[0030]结合本发明第一方面可能的实施方式,或者结合本发明第一方面第一种可能的实施方式,或者结合本发明第一方面第二种可能的实施方式,或者结合本发明第一方面第三种可能的实施方式,或者结合本发明第一方面第四种可能的实施方式,或者结合本发明第一方面第五种可能的实施方式,在第六种可能的方式中,将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,包括:将所述目标地址信息中的至少一个子地址信息分别与所述地址数据库中地址类型相同的子地址信息进行相应匹配。
[0031]结合本发明第一方面可能的实施方式,或者结合本发明第一方面第一种可能的实施方式,或者结合本发明第一方面第二种可能的实施方式,或者结合本发明第一方面第三种可能的实施方式,或者结合本发明第一方面第四种可能的实施方式,或者结合本发明第一方面第五种可能的实施方式,在第七种可能的方式中,将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,包括:
[0032]从地址数据库中选择一个地址信息,确定选择的地址信息中包含的子地址信息;
[0033]分别将待搜索的目标地址中包含的至少一个子地址信息与选择的地址信息中包含的子地址信息进行匹配计算,得到第一匹配度,其中,进行匹配计算的所述待搜索的目标地址中包含的子地址信息的地址类型与选择的地址信息中包含的子地址信息的地址类型相同;
[0034]根据所述第一匹配度,得到选择的地址信息与待搜索的目标地址信息的总匹配度。
[0035]结合本发明第一方面第七种可能的实施方式,在第八种可能的方式中,根据所述第一匹配度,得到选择的地址信息与待搜索的目标地址信息的总匹配度,包括:
[0036]将选择的地址信息与待搜索的目标地址信息进行匹配计算,得到第二匹配度;
[0037]根据所述第一匹配度和所述第二匹配度,得到选择的地址信息与待搜索的目标地址信息的总匹配度。
[0038]结合本发明第一方面第六种可能的实施方式,或者结合本发明第一方面第七种可能的实施方式,或者结合本发明第一方面第八种可能的实施方式,在第九种可能的方式中,将待搜索的目标地址中包含的子地址信息与选择的地址信息中包含的子地址信息进行匹配计算,得到第一匹配度,包括:
[0039]针对待搜索的目标地址信息中包含的每一个子地址信息,执行:
[0040]针对该子地址信息,从选择的地址信息中查找出与该子地址信息属于同一地址类型的子地址信息;
[0041]计算将该子地址信息与查找到的子地址信息进行相互转换所需的编辑距离;
[0042]根据待搜索的目标地址信息中包含的每一个子地址信息分别对应得到的编辑距离,计算所述第一匹配度。
[0043]结合本发明第一方面第六种可能的实施方式,或者结合本发明第一方面第七种可能的实施方式,或者结合本发明第一方面第八种可能的实施方式,或者结合本发明第一方面第九种可能的实施方式,在第十种可能的方式中,将匹配得到的匹配度大于设定阈值的地址信息,作为搜索到的目标地址信息进行输出,包括:
[0044]根据计算得到每一次选择的地址信息与待搜索的目标地址信息的总匹配度,按照总匹配度从大到小的顺序,依次确定设定个数的总匹配度;
[0045]将确定的总匹配度分别对应选择的地址信息,作为搜索到的目标地址信息进行输出。
[0046]根据本发明的第二方面,提供了一种地址搜索设备,包括:
[0047]获取模块,用于获取地址搜索请求信息,并确定所述地址搜索请求信息中包含的待搜索的目标地址信息;
[0048]拆分模块,用于将所述获取模块确定的所述目标地址信息拆分为至少一个子地址信息,所述目标地址信息为由多个不同的子地址信息组成的,所述多个不同的子地址信息分别对应不同的地址类型;
[0049]搜索模块,用于将所述拆分模块得到的所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,其中,所述地址数据库中存储的每一条地址信息包含构成该地址信息的不同子地址信息;将匹配得到的匹配度大于设定阈值的地址信息,作为搜索到的目标地址信息进行输出。
[0050]结合本发明第二方面可能的实施方式,在第一种可能的方式中,所述获取模块,具体用于接收输入的语音数据,其中,所述语音数据用以发起地址搜索;
[0051]对所述语音数据进行识别,得到所述语音数据中包含的待搜索的目标地址信息。
[0052]结合本发明第二方面可能的实施方式,或者结合本发明第二方面第一种可能的实施方式,在第二种可能的方式中,所述获取模块,具体用于通过以下方式得到待搜索的目标地址信息:
[0053]确定所述地址搜索请求信息中包含的至少一个关键词;
[0054]针对确定的每一个关键词,执行:在预先设置的对应不同地址类型的文本地址词典中,找到包含该关键词的文本地址词典;利用用于表征找到的文本地址词典对应的地址类型的字符串,替换该关键词;
[0055]利用用以表示地址信息的正则表达式,判断每一个关键词被替换为对应的字符串后构成的字符串组是否表示地址信息;
[0056]在确定所述字符串组表示地址信息时,根据所述字符串组确定待搜索的目标地址信息对应的准地址字符串;
[0057]将所述准地址字符串作为一个条件随机场CRF特征,基于CRF算法在所述地址搜索请求息中提取待搜索的目标地址信息。
[0058]结合本发明第二方面第二种可能的实施方式,在第三种可能的实施方式中,所述获取模块,具体用于根据所述字符串组确定待搜索的目标地址信息对应的准地址字符串,具体包括:
[0059]确定所述字符串组包含的字符串为多个、且在多个字符串分别替换的关键词在所述地址搜索请求信息中位置连续;
[0060]若多个字符串不存在重复时,将所述多个字符串基于替换的关键词的位置连续性合并为一个字符串组,作为待搜索的目标地址信息对应的准地址字符串;
[0061]若多个字符串存在重复时,去除重复的字符串,并将去除重复的字符串后的至少一个字符串基于替换的关键词的位置连续性合并为一个字符串组,作为待搜索的目标地址信息对应的准地址字符串。
[0062]结合本发明第二方面可能的实施方式,或者结合本发明第二方面第一种可能的实施方式,或者结合本发明第二方面第二种可能的实施方式,或者结合本发明第二方面第三种可能的实施方式,在第四种可能的方式中,所述拆分模块,具体用于根据预先设置的对应不同地址类型的文本地址词典所表示的地址类型,从所述目标地址信息中拆分出对应不同地址类型的子地址信息。
[0063]结合本发明第二方面可能的实施方式,或者结合本发明第二方面第一种可能的实施方式,或者结合本发明第二方面第二种可能的实施方式,或者结合本发明第二方面第三种可能的实施方式,或者结合本发明第二方面第四种可能的实施方式,在第五种可能的方式中,所述地址类型包括下述中的一种或多种信息组合:
[0064]行政区域信息、道路名称信息、建筑/单位名称信息、所述道路名称的附属内容、所述建筑/单位名称的附属内容。
[0065]结合本发明第二方面可能的实施方式,或者结合本发明第二方面第一种可能的实施方式,或者结合本发明第二方面第二种可能的实施方式,或者结合本发明第二方面第三种可能的实施方式,或者结合本发明第二方面第四种可能的实施方式,或者结合本发明第二方面第五种可能的实施方式,在第六种可能的方式中,所述搜索模块,具体用于将所述目标地址信息中的至少一个子地址信息分别与所述地址数据库中地址类型相同的子地址信息进行相应匹配。
[0066]结合本发明第二方面可能的实施方式,或者结合本发明第二方面第一种可能的实施方式,或者结合本发明第二方
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1