本公开涉及计算机,具体地,涉及一种地址识别方法、装置、介质和电子设备。
背景技术:
1、正地理解析通常用于表示将指定的一个地址文本转化为经纬度坐标,从而实现对地址的准确表示。相关技术中,进行地址识别时通常是先建立一个底层地址库(如地址库包含地址基础属性:行政区划、经纬度、地址文本等),在此基础上,基于待查询的地址文本先召回候选数据集,再从候选的数据集中找出最匹配的地址文本,从而将该匹配的地址文本的经纬度作为待查询的地址文本的经纬度。
技术实现思路
1、提供该
技术实现要素:
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
2、第一方面,本公开提供一种地址识别方法,所述方法包括:
3、接收待识别的地址文本;
4、根据所述地址文本和地址编码模型,生成所述地址文本对应的地理位置编码序列,其中,地址编码模型包含编码器和解码器,所述编码器用于提取所述地址文本的地址特征向量,所述解码器用于基于所述地址特征向量进行解码,以获得所述地理位置编码序列;
5、根据所述地理位置编码序列,确定所述地址文本对应的经纬度信息。
6、第一方面,本公开提供一种地址识别装置,所述装置包括:
7、接收模块,用于接收待识别的地址文本;
8、生成模块,用于根据所述地址文本和地址编码模型,生成所述地址文本对应的地理位置编码序列,其中,地址编码模型包含编码器和解码器,所述编码器用于提取所述地址文本的地址特征向量,所述解码器用于基于所述地址特征向量进行解码,以获得所述地理位置编码序列;
9、确定模块,用于根据所述地理位置编码序列,确定所述地址文本对应的经纬度信息。
10、第一方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面所述方法的步骤。
11、第一方面,本公开提供一种电子设备,包括:
12、存储装置,其上存储有计算机程序;
13、处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面所述方法的步骤。
14、由此,可以根据地址文本和地址编码模型,生成地址文本对应的地理位置编码序列,进而根据所述地理位置编码序列,确定所述地址文本对应的经纬度信息。其中基于该地址编码模型确定地理位置编码序列时,可以基于序列生成的方式进行编码生成,从而可以有效降低地址识别过程确定地址文本对应的地理位置编码序列所需的时间和计算量,简化地址识别的过程,从而提高地址识别的效率。另外,本公开的方案中通过编码生成的方式可以避免相关技术中召回和排序的过程,在提高识别效率的同时可以能够在一定程度上提高地址识别的准确性,同时可以不依赖底层数据库中的数据直接输出地址文本的经纬度信息,方便地址识别方法和地址编码模型的后续维护。
15、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
1.一种地址识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述地址编码模型通过以下方式确定:
3.根据权利要求2所述的方法,其特征在于,所述根据所述地理位置编码标注序列和所述预测分布,确定所述地理位置编码训练序列中每一字符对应的目标损失,包括:
4.根据权利要求2所述的方法,其特征在于,所述获取训练样本集,包括:
5.根据权利要求1所述的方法,其特征在于,所述地理位置编码序列为geohash编码序列。
6.根据权利要求1所述的方法,其特征在于,在所述解码器中基于所述地址特征向量进行解码的过程中,所述地址特征向量作为初始状态输入所述解码器,所述解码器在上一时刻的解码输出作为当前时刻的输入,以依次对所述地理位置编码序列中的每一位置的字符进行解码。
7.根据权利要求1所述的方法,其特征在于,所述根据所述地理位置编码序列,确定所述地址文本对应的经纬度信息,包括:
8.一种地址识别装置,其特征在于,所述装置包括:
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括: