本发明涉及地址定位,尤其涉及一种基于地址知识图谱的定位方法及装置。
背景技术:
1、地址定位服务是指根据用户输入的地址文本,返回该地址文本对应的位置信息,例如范围该地址文本的经纬度信息。地址定位服务在物流运输、订单派送、火警救援、位置查询等方面有着广泛的应用。
2、现有地址定位服务采用自然语言处理的技术,通过深度学习方法,建模输入文本的语义信息,将输入文本信息与地址库中地址文本进行文本匹配,查找出地址库中与之匹配的点位经纬度信息作为输出。
3、然而,经实践发现,地址定位偶尔会出现错误的情况。因此,地址定位的准确性有待进一步提高。
技术实现思路
1、本发明所要解决的技术问题在于,地址定位偶尔会出现错误。因此,本发明提供一种基于地址知识图谱的定位方法及装置,能够提高地址定位的准确性。
2、为了解决上述技术问题,本发明第一方面公开了一种基于地址知识图谱的定位方法,所述方法包括:
3、获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体;
4、提取所述目标地址文本中的至少两个目标地址实体;
5、根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
6、作为一种可选的实施方式,在本发明第一方面中,所述地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有n级层级关系,n为1以上的自然数;
7、所述根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
8、根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;
9、从匹配地址元素中筛选出具有连接关系的匹配地址元素;
10、确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
11、将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
12、作为一种可选的实施方式,在本发明第一方面中,所述地址属性信息包括至少两个所述地址实体;
13、所述从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素,包括:
14、将对应的至少两个地址实体中的其中一个地址实体与所述目标地址实体一致的地址元素,作为所述匹配地址元素。
15、作为一种可选的实施方式,在本发明第一方面中,所述提取所述目标地址文本中的至少两个目标地址实体,包括:
16、通过定位应用程序的api接口提取所述目标地址文本中的至少两个目标地址实体;和/或,
17、通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
18、作为一种可选的实施方式,在本发明第一方面中,所述地址知识图谱的建立方式,包括:
19、获取地址文本数据;
20、从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息;
21、接收输入的多个所述地址元素之间的层级关系;
22、将所述地址元素、多个所述所述地址实体分别对应的地址属性信息和多个所述地址元素之间的层级关系通过多元组的形式,构建多元组信息;
23、将所述多元组信息录入至知识图谱数据库中,得到所述地址知识图谱。
24、作为一种可选的实施方式,在本发明第一方面中,所述地址文本数据的来源为至少两个;
25、在所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息之前,所述方法还包括:
26、对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种;
27、所述从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息,包括:
28、从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息。
29、作为一种可选的实施方式,在本发明第一方面中,所述根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,包括:
30、根据至少两个所述目标地址实体构建sql语句;
31、基于所述sql语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素;
32、从匹配地址元素中筛选出具有连接关系的匹配地址元素;
33、确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;
34、将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
35、本发明第二方面公开了一种基于地址知识图谱的定位装置,所述装置包括:
36、获取模块,用于获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的位置信息和多个所述地址元素之间的父子级关系建立的;
37、提取模块,用于提取所述目标地址文本中的目标地址实体;
38、定位模块,用于根据所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息。
39、作为一种可选的实施方式,在本发明第二方面中,所述地址知识图谱用于指示地址元素之间的连接关系以及各地址元素对应的地址属性信息,连接的两个地址元素之间具有n级层级关系,n为1以上的自然数;定位模块用于根据所述地址属性信息从所述地址知识图谱中查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
40、作为一种可选的实施方式,在本发明第二方面中,地址属性信息包括至少两个所述地址实体;定位模块用于将对应的至少两个地址实体中的其中一个地址实体与所述目标地址实体一致的地址元素,作为所述匹配地址元素。
41、作为一种可选的实施方式,在本发明第二方面中,提取模块用于通过定位应用程序的api接口提取所述目标地址文本中的至少两个目标地址实体;和/或,
42、通过预先训练完成的实体提取模型提取所述目标地址文本中的至少两个目标地址实体,所述实体提取模型是通过地址文本与地址文本对应的地址元素标签训练得到的。
43、作为一种可选的实施方式,在本发明第二方面中,该装置还包括:
44、构建模块,用于获取地址文本数据;从所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息;接收输入的多个所述地址元素之间的层级关系;将所述地址元素、多个所述所述地址实体分别对应的地址属性信息和多个所述地址元素之间的层级关系通过多元组的形式,构建多元组信息;将所述多元组信息录入至知识图谱数据库中,得到所述地址知识图谱。
45、作为一种可选的实施方式,在本发明第二方面中,所述地址文本数据的来源为至少两个;
46、该装置还包括:
47、清洗处理模块,用于对所述地址文本数据进行清洗处理,得到清洗处理后的所述地址文本数据,所述清洗处理包括繁简转换处理、英文字母的大小写转换处理、标点符号去除处理和数据去重处理中的至少一种;
48、该构建模块用于从清洗处理后的所述地址文本数据中提取多个地址元素以及多个地址元素分别对应的地址属性信息。
49、作为一种可选的实施方式,在本发明第二方面中,定位模块用于根据至少两个所述目标地址实体构建sql语句;基于所述sql语句从所述知识图谱数据库查找各所述目标地址实体相匹配的匹配地址元素;从匹配地址元素中筛选出具有连接关系的匹配地址元素;确定具备连接关系的匹配地址元素中的最后一级匹配地址元素;将所述最后一级匹配地址元素对应的位置信息作为所述目标位置信息。
50、本发明第三方面公开了另一种基于地址知识图谱的定位装置,所述装置包括:
51、存储有可执行程序代码的存储器;
52、与所述存储器耦合的处理器;
53、所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于地址知识图谱的定位方法。
54、本发明第四方面公开了一种计算机可存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于地址知识图谱的定位方法。
55、与现有技术相比,本发明实施例具有以下有益效果:
56、本发明实施例中,通过获取目标地址文本和地址知识图谱,所述地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,所述地址属性信息包括位置信息和地址实体;提取所述目标地址文本中的至少两个目标地址实体;根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,由于地址知识图谱是根据多个地址元素分别对应的地址属性信息和多个所述地址元素之间的层级关系建立的,因此根据至少两个所述目标地址实体和所述地址知识图谱,确定所述目标地址文本对应的目标位置信息,相当于利用了多个所述地址元素之间的层级关系来进行地址定位,也就是说,本实施例有效利用地址层级或者地址实体关联先验信息,解决了现有技术未能有效利用地址层级或者地址实体关联先验信息,使得地址定位到错误的经纬度,能够使得地址定位的准确度得以进一步提高。